Рубріки: Новини

Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель

Дмитро Сімагін

Група дослідників з інституту INSAIT (Болгарія) та ETH Zurich (Швейцарія) представила першу безкоштовну LLM-модель, спеціально навчену для роботи українською мовою. Модель, яка отримала назву MamayLM, має 9 мільярдів параметрів, повідомляє блог Hugging Face. 

Як запевняють автори розробки, MamayLM є найефективнішою мовною моделлю для генерації якісних та змістовних відповідей українською мовою. Нова модель демонструє найвищий результат на іспитах ЗНО (Зовнішнє незалежне оцінювання) серед аналогічних LLM подібного розміру, випереджаючи навіть значно більші моделі, такі як Gemma2 27B, Llama 3.1 70B та Qwen 2.5 72B.

MamayLM може працювати локально на одній GPU. Вона побудована на основі моделі Google Gemma 2 9B, яку INSAIT раніше використовував для розробки серії моделей для болгарської мови BgGPT 2.0. Для тренування MamayLM використали 75 мільярдів токенів українського та англійського тексту.

Нова модель MamayLM не тільки адаптована до специфіки української мови, але є експертом у культурних нюансах. Її можна використовувати для особистого використання або для створення додатків та їхньої інтеграції в державні установи — особливо в умовах, коли критично важливо зберігати конфіденційність даних (оскільки модель такого невеликого розміру може працювати локально).

Останні статті

В США відбулися перші змагання програмістів проти штучного інтелекту

У Сан-Франциско відбувся перший хакатон по кодингу, де змагалися програмісти та штучний інтелект. У заході…

12.09.2025

Microsoft нагадує про припинення підтримки мови VBScript у Windows

Компанія Microsoft нагадала про намір відмовитися від використання скриптової мови VBScript у Windows. Вперше про…

12.09.2025

Claude отримав функцію пам’яті, перенесення даних та анонімний чат

Компанія Anthropic анонсувала новий набір функцій для своєї платформи Claude. Одна з них дозволяє Claude…

12.09.2025

Редактор коду Visual Studio Code отримав автоматичний вибір LLM-моделі та нові функції безпеки

Microsoft оновила редактор коду Visual Studio Code. У новій версії 1.104 з'явився автоматичний вибір LLM-моделі…

12.09.2025

У США можуть ухвалити закон про податок з іноземного аутсорсингу. Чим це загрожує українським IT-фахівцям?

Сенатор-республіканець Берні Морено вніс на розгляд законопроект «Про зупинення міжнародного переміщення працівників» (HIRE Act). У…

12.09.2025

У ChatGPT з’явився Режим розробника

OpenAI запустила Режим розробника для користувачів тарифних планів ChatGPT Plus і Pro. Нова бета-функція забезпечує…

11.09.2025