Рубріки: Новини

Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель

Дмитро Сімагін

Група дослідників з інституту INSAIT (Болгарія) та ETH Zurich (Швейцарія) представила першу безкоштовну LLM-модель, спеціально навчену для роботи українською мовою. Модель, яка отримала назву MamayLM, має 9 мільярдів параметрів, повідомляє блог Hugging Face. 

Як запевняють автори розробки, MamayLM є найефективнішою мовною моделлю для генерації якісних та змістовних відповідей українською мовою. Нова модель демонструє найвищий результат на іспитах ЗНО (Зовнішнє незалежне оцінювання) серед аналогічних LLM подібного розміру, випереджаючи навіть значно більші моделі, такі як Gemma2 27B, Llama 3.1 70B та Qwen 2.5 72B.

MamayLM може працювати локально на одній GPU. Вона побудована на основі моделі Google Gemma 2 9B, яку INSAIT раніше використовував для розробки серії моделей для болгарської мови BgGPT 2.0. Для тренування MamayLM використали 75 мільярдів токенів українського та англійського тексту.

Нова модель MamayLM не тільки адаптована до специфіки української мови, але є експертом у культурних нюансах. Її можна використовувати для особистого використання або для створення додатків та їхньої інтеграції в державні установи — особливо в умовах, коли критично важливо зберігати конфіденційність даних (оскільки модель такого невеликого розміру може працювати локально).

Останні статті

OpenAI випустила Codeх для macOS і розповіла, скільки розробників щомісяця з ним працюють

OpenAI випустила настільний додаток Codex для платформи macOS. До сьогодні програмістам на Apple доводилося шукати…

03.02.2026

Вразливість Microsoft Office використовують для атак з нібито попередженням Укргідрометцентру

За даними української команди реагування CERT-UA, виявлена на минулому тижні вразливість CVE-2026-21509, яка є помилкою…

03.02.2026

Google тестує інструмент для перенесення в Gemini діалогів з ChatGPT та інших чат-ботів

Google працює над новою функцією Gemini під назвою Import AI chats, яка зараз знаходиться на…

03.02.2026

Популярний редактор коду Notepad++ зламано

Команда Notepad++ оголосила, що її інфраструктуру оновлень було скомпрометовано китайським хакером у період між червнем…

02.02.2026

Україна може допомогти Європі зменшити технологічну залежність від США та Китаю — дослідження

Україна здатна допомогти Європейському Союзу зменшити частину його технологічних залежностей від США та Китаю. Про…

02.02.2026

Anthropic додала агентні плагіни в інструмент автоматизації Cowork

Компанія Anthropic інтегрувала в Cowork агентні плагіни, які дозволяють налаштовувати модель Claude під конкретні корпоративні…

02.02.2026