Михайло Федоров розповів, коли почнеться бета-тестування національної LLM
Розробка української національної LLM виходить на завершальну стадію. Вже навесні команда «Київстар» разом з фахівцями Мінцифри почнуть бета-тестування моделі. До кінця січня в «Дії» проведуть голосування щодо її назви. Про це в своєму Telegram-каналі розповів віце-прем’єр-міністр Михайло Федоров.
Урядовець запевняє, що запуск власної великої мовної моделі допоможе Україні увійти в Топ-3 країн за розвитком штучного інтелекту у світі. На відміну від багатьох інших LLM, майбутня система ШІ буде навчена на унікальних українських даних.
«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями — це терабайти унікальних даних», — пише Федоров.
Група експертів уже працює над створенням бенчмарків — тестів, які допоможуть оцінювати й покращувати якість моделі. Найближчими тижнями проект отримає:
- першу базу текстів для тренування LLM;
- покращений токенізатор — інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше та продуктивніше;
- власні бенчмарки для оцінки якості.
Якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей. Вони перевірятимуть технічну якість моделі, етичність та безпечність для користувачів, знання української мови та розуміння національного контексту.












Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: