Рубріки: Новини

Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель

Дмитро Сімагін

Група дослідників з інституту INSAIT (Болгарія) та ETH Zurich (Швейцарія) представила першу безкоштовну LLM-модель, спеціально навчену для роботи українською мовою. Модель, яка отримала назву MamayLM, має 9 мільярдів параметрів, повідомляє блог Hugging Face. 

Як запевняють автори розробки, MamayLM є найефективнішою мовною моделлю для генерації якісних та змістовних відповідей українською мовою. Нова модель демонструє найвищий результат на іспитах ЗНО (Зовнішнє незалежне оцінювання) серед аналогічних LLM подібного розміру, випереджаючи навіть значно більші моделі, такі як Gemma2 27B, Llama 3.1 70B та Qwen 2.5 72B.

MamayLM може працювати локально на одній GPU. Вона побудована на основі моделі Google Gemma 2 9B, яку INSAIT раніше використовував для розробки серії моделей для болгарської мови BgGPT 2.0. Для тренування MamayLM використали 75 мільярдів токенів українського та англійського тексту.

Нова модель MamayLM не тільки адаптована до специфіки української мови, але є експертом у культурних нюансах. Її можна використовувати для особистого використання або для створення додатків та їхньої інтеграції в державні установи — особливо в умовах, коли критично важливо зберігати конфіденційність даних (оскільки модель такого невеликого розміру може працювати локально).

Останні статті

Найкращий квартал року: експорт ІТ-послуг з України демонструє зростання

За підсумками вересня 2025 року обсяг IT-експорту з України становив $557 мільйонів, що на $17…

31.10.2025

Android-смартфони краще захищені від шахраїв, ніж iPhone — дослідження

Спільне дослідження компаній Google і YouGov доводить, що через гаджети на базі Android рідше трапляються…

31.10.2025

FAVBET Tech увійшов у топ-5 платників податків серед резидентів «Дія.City»

Українська ІТ-компанія FAVBET Tech увійшла до топ-5 найбільших платників податків серед резидентів «Дія.City» за підсумками…

31.10.2025

Розробники TikTok зекономили компанії $300 000 на рік: просто переписали код Go API на Rust

Розробники TikTok переписали критично важливі Go API на Rust, що призвело до подвійного збільшення продуктивності…

31.10.2025

OpenAI випустила інструмент Aardvark для пошуку вразливостей в коді

OpenAI представила Aardvark — новий агент штучного інтелекту на базі GPT-5, який допомагає розробникам шукати…

31.10.2025

Новий фреймворк Google ADK дозволяє створювати агентів на Python і Java

Компанія Google оновила фреймворк ADK (Agent Development Kit). Вперше представлений у квітні цього року, ADK…

31.10.2025