Рубріки: Новости

За донат на ВСУ: AI HOUSE запускает воркшоп по распознаванию контекста украинских слов с помощью NLP и LLMs

Ігор Шелудченко

Некоммерческая организация AI HOUSE объявила о запуске офлайн-воркшопа Ukrainian Words Clarity with LLMs, где научат распознавать контекст украинских слов.

Как сообщил Highload AI HOUSE, участники будут работать с украинским языком с помощью NLP (Natural Language Processing), распознаванием контекста слов с несколькими значениями и файнтюнингом LLMs (Large Language Models).

Участие в воркшопе предоставляется за свободный донат от 200 грн, а все средства пойдут на помощь украинской артиллерии.

Для кого

Воркшоп будет полезен для специалистов/ок, имеющих более года опыта в ML и Python, английский на уровне Upper-Intermediate и осведомленность об архитектуре Transformer.

Формат и лекторы

Воркшоп Ukrainian Words Clarity with LLMs пройдет 29 апреля в Киеве в оффлайн-формате.

На первой части участники обсудят исследования лекторов по WSD (word-sense disambiguation) задаче для украинского языка, их подход и файнтюнинг LLMs.

Во второй половине — участники собственноручно воспроизведут этот подход на части данных и научатся файнтюнить большие языковые модели на практике, выбирать стратегии предвидения и работать с украинским языком.

Лекторы

Владимир Мудрый

  • Data Scientist в Intelliarts;
  • специализируется на классическом ML и работает в области более 4 лет;
  • в свободное время проводит исследования по машинному обучению и преподает ML в НУ «Львовская политехника»

Юрий Лаба

  • ML-инженер в Intelliarts;
  • закончил УКУ и ныне имеет более 4 лет опыта в Data Science
  • В последние два года Юрий работал в области NLP, решая различные задачи, а именно семантический поиск, распознавание именуемых сущностей, text summarization и т.д.

Темы воркшопа

  1. Разбор пейпера лекторов с WSD (word-sense disambiguation) задачи для украинского языка, их подход и файнтюнинг LLMs;
  2. LLMs и Sentence transformers;
  3. Semi-supervised approach для сбора данных;
  4. Обсуждение фреймворка WSD;
  5. Практическая часть по генерации датасета и файнтюнинга.

Что получат участники

В результате обучения слушатели получат:

  • опыт работы с украинским языком в контексте NLP;
  • понимание задачи распознавания контекста слов с несколькими смыслами (word-sense disambiguation task);
  • знание, как файнтюнить sentence transformers модели для языков с ограниченными ресурсами;
  • практический опыт файнтюнинга моделей sentence transformers для задания WSD.

Как присоединиться

Воркшоп состоится 29 апреля и продлится с 11:30 до 18:00, в Киеве.

После завершения участники смогут обсудить все вопросы с лекторами и остаться на нетворкинге. 

Присоединиться к офлайн-воркшопу можно за донат 200 грн. Все полученные средства будут направлены в фонд « Реактивная почта»  на нужды украинской артиллерии. Участникам воркшопа нужно иметь аккаунт Google и быть знакомым с Google Colab. Подать заявку на участие можно до 23 апреля (включительно).

Зарегистрироваться на воркшоп можно по ссылке.

Останні статті

Что такое прокси-сервер: пояснение простыми словами, зачем нужны прокси

Прокси (proxy), или прокси-сервер — это программа-посредник, которая обеспечивает соединение между пользователем и интернет-ресурсом. Принцип…

21.11.2024

Что такое PWA приложение? Зачем необходимо прогрессивное веб-приложение

Согласитесь, было бы неплохо соединить в одно сайт и приложение для смартфона. Если вы еще…

19.11.2024

Как создать игру на телефоне: программирование с помощью конструктора

Повсеместное распространение смартфонов привело к огромному спросу на мобильные игры и приложения. Миллиарды пользователей гаджетов…

17.11.2024

Google Bard: эффективный аналог ChatGPT

В перечне популярных чат-ботов с искусственным интеллектом Google Bard (Gemini) еще не пользуется такой популярностью…

14.11.2024

Скрипт и программирование: что это такое простыми словами

Скрипт (англ. — сценарий), — это небольшая программа, как правило, для веб-интерфейса, выполняющая определенную задачу.…

12.11.2024

Дедлайн в разработке: что это такое простыми словами

Дедлайн (от англ. deadline — «крайний срок») — это конечная дата стачи проекта или задачи…

11.11.2024