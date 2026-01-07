Михайло Федоров розповів, коли почнеться бета-тестування національної LLM

Розробка української національної LLM виходить на завершальну стадію. Вже навесні команда «Київстар» разом з фахівцями Мінцифри почнуть бета-тестування моделі. До кінця січня в «Дії» проведуть голосування щодо її назви. Про це в своєму Telegram-каналі розповів віце-прем’єр-міністр Михайло Федоров.

Урядовець запевняє, що запуск власної великої мовної моделі допоможе Україні увійти в Топ-3 країн за розвитком штучного інтелекту у світі. На відміну від багатьох інших LLM, майбутня система ШІ буде навчена на унікальних українських даних.

«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями — це терабайти унікальних даних», — пише Федоров.

Група експертів уже працює над створенням бенчмарків — тестів, які допоможуть оцінювати й покращувати якість моделі. Найближчими тижнями проект отримає:

першу базу текстів для тренування LLM;

покращений токенізатор — інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше та продуктивніше;

власні бенчмарки для оцінки якості.

Якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей. Вони перевірятимуть технічну якість моделі, етичність та безпечність для користувачів, знання української мови та розуміння національного контексту.