Рубріки: Новини

Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель

Дмитро Сімагін

Група дослідників з інституту INSAIT (Болгарія) та ETH Zurich (Швейцарія) представила першу безкоштовну LLM-модель, спеціально навчену для роботи українською мовою. Модель, яка отримала назву MamayLM, має 9 мільярдів параметрів, повідомляє блог Hugging Face. 

Як запевняють автори розробки, MamayLM є найефективнішою мовною моделлю для генерації якісних та змістовних відповідей українською мовою. Нова модель демонструє найвищий результат на іспитах ЗНО (Зовнішнє незалежне оцінювання) серед аналогічних LLM подібного розміру, випереджаючи навіть значно більші моделі, такі як Gemma2 27B, Llama 3.1 70B та Qwen 2.5 72B.

MamayLM може працювати локально на одній GPU. Вона побудована на основі моделі Google Gemma 2 9B, яку INSAIT раніше використовував для розробки серії моделей для болгарської мови BgGPT 2.0. Для тренування MamayLM використали 75 мільярдів токенів українського та англійського тексту.

Нова модель MamayLM не тільки адаптована до специфіки української мови, але є експертом у культурних нюансах. Її можна використовувати для особистого використання або для створення додатків та їхньої інтеграції в державні установи — особливо в умовах, коли критично важливо зберігати конфіденційність даних (оскільки модель такого невеликого розміру може працювати локально).

Останні статті

ЄС розробляє законодавство для «легального злому» зашифрованого листування

Європейський Союз готує законодавчу базу, яка відкриє правоохоронцям доступ до зашифрованих даних на мобільних пристроях…

23.04.2025

Google залишить сторонні файли cookie в Chrome. Після кількох років обіцянок позбутися від них

Після шести років роботи над веб-стандартом Privacy Sandbox компанія Google вирішила відмовитись від спроб позбавитись…

23.04.2025

Нові функції Резерв+: push-сповіщення та завантаження розширених даних про користувача

Мобільний застосунок для військовозобов’язаних «Резерв+» оновлено до версії 1.6.0. Нова версія вже доступна усім користувачам,…

23.04.2025

Дослідження розкрило головну проблему командної розробки. І це не швидкість

Опитування, проведене Earthly серед понад 100 команд розробників з провідних IT-компаній, таких як LinkedIn, Roblox,…

23.04.2025

Студент, якого вигнали за розробку бота для обману на співбесідах, отримав $5,3 млн інвестицій

21-річний студент Колумбійського університету (США) Чунгін Лі був відрахований за написання бота, який допомагає розробникам…

22.04.2025

Барак Обама заявив, що штучний інтелект вже кращий, ніж 70% кодерів

Колишній президент США Барак Обама заявив, що в недалекому майбутньому через штучний інтелект багато висококваліфікованих…

22.04.2025