Кар'єра 12/04/2023 16:28

За донат на ЗСУ: AI HOUSE запускає воркшоп з розпізнавання контексту українських слів за допомогою NLP та LLMs

Редактор у Highload

Некомерційна організація AI HOUSE оголосила про запуск офлайн-воркшопу Ukrainian Words Clarity with LLMs, де навчать розпізнавати контекст українських слів.

Як повідомив Highload AI HOUSE, учасники працюватимуть з українською мовою за допомогою NLP (Natural Language Processing), розпізнаванням контексту слів з кількома значеннями та файнтюнингом LLMs (Large Language Models).

Участь у воркшопі надається за вільний донат від 200 грн, а всі кошти підуть на допомогу українській артилерії.

Для кого

Воркшоп буде корисним для спеціалістів/ок, які мають понад рік досвіду в ML та Python, англійську на рівні Upper-Intermediate та обізнаність щодо архітектури Transformer.

Формат та лектори

Воркшоп Ukrainian Words Clarity with LLMs пройде 29 квітня у Києві в офлайн-форматі.

На першій частині учасники обговорять дослідження лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs.

У другій половині — учасники/ці власноруч відтворять цей підхід на частині даних і навчаться файнтюнити великі мовні моделі на практиці, вибирати стратегії передбачення та працювати з українською мовою.

Лектори

Володимир Мудрий

Data Scientist в Intelliarts;
спеціалізується на класичному ML і працює у сфері понад 4 роки;
у вільний час проводить дослідження з машинного навчання та викладає ML у НУ «Львівська політехніка»

Юрій Лаба

ML Engineer в Intelliarts;
закінчив УКУ та нині має понад 4 роки досвіду в Data Science
Протягом останніх двох років Юрій працював у галузі NLP, вирішуючи різні завдання, а саме семантичний пошук, розпізнавання іменованих сутностей, text summarization тощо.

Теми воркшопу

Розбір пейперу лекторів з WSD (word-sense disambiguation) задачі для української мови, їх підхід та файнтюнинг LLMs;
LLMs та Sentence transformers;
Semi-supervised approach для збору даних;
Обговорення фреймворку WSD;
Практична частина з генерації датасету та файнтюнингу.

Що отримають учасники

В результаті навчання слухачі отримають:

досвід роботи з українською мовою в контексті NLP;
розуміння задачі розпізнавання контексту слів з декількома сенсами (word-sense disambiguation task);
знання, як файнтюнити sentence transformers моделі для мов з обмеженими ресурсами;
практичний досвід файнтюнингу моделей sentence transformers для завдання WSD.

Як доєднатися

Воркшоп відбудеться 29 квітня та буде тривати з 11:30 до 18:00, в м. Києві.

Після завершення учасники зможуть обговорити всі запитання з лекторами та залишитися на нетворкінг.

Доєднатися до офлайн-воркшопу можна за донат 200 грн. Усі отримані кошти будуть направлені до фонду «Реактивна пошта» на потреби української артилерії. Учасникам воркшопу потрібно мати обліковий запис Google та бути знайомим/ою з Google Colab. Подати заявку на участь можна до 23 квітня (включно).

Зареєструватися на воркшоп можна за посиланням.