Рубріки: Новини

Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце

Дмитро Сімагін

Міністр цифрової трансформації Михайло Федоров заявив, що майбутню українську LLM тренуватимуть на моделі Gemma 3 від Google. Цю велику мовну модель було обрано разом з фахівцями Kyivstar, написав урядовець в своєму Telegram.

«Ми натренуємо open-source- модель від Google на унікальних україномовних текстах і вдосконалимо її роботу з українською мовою, щоб модель працювала максимально безпечно та якісно», — запевнили в Мінцифри.

Також міністр наводить ключові переваги Gemma:

  • оптимальний баланс продуктивності та ресурсів;
  • уже підтримує українську мову;
  • працює не лише з текстом, а й із зображеннями;
  • стала основою для найкращих українськомовних моделей.

Варто зауважити, що в загальному рейтингу LMArena модель Gemma 3, яку випустили 12 березня 2025 року, зараз займає 78 місце. З іншого боку, відкриті LLM-моделі з більш високою продуктивністю, ніж Gemma 3, розроблені переважно в Китаї, що накладає певні обмеження для українських державних структур. 

Згідно дорожньої мапи проекту, наступний крок передбачає донавчання Gemma на унікальних українськомовних текстах та тестування якості моделі через бенчмарки.

Нагадаємо, що незабаром український бізнес зможе випускати свої моделі на основі національної LLM. Про таку можливість заявив Дмитро Овчаренко — керівник WINWIN AI Center of Excellence при Мінцифри. Також, за його словами, штучний інтелект вже скоротив процес найму в Міністерстві цифрової трансформації на 45%.

 

Останні статті

Німецький науковець винайшов формулу, як підвищити продуктивність робочого дня

Дослідник Ніхіл Ліндерман з Німеччини вирішив розібратися, як підвищити продуктивність офісного працівника. Для цього він…

01.12.2025

Women in Tech Conference 2025: Безкоштовна онлайн-подія для ІТ та бізнесу

З метою підтримки інклюзивності, рівних можливостей та жіночого лідерства у діджитал-сфері, 5–6 грудня 2025 року…

01.12.2025

Дуров запустив Cocoon — децентралізовану мережу, де користувачі можуть заробляти на оренді GPU

Павло Дуров оголосив про запуск Confidential Compute Open Network (Cocoon) — конфіденційної, відкритої та децентралізованої…

01.12.2025

У КПІ будуть викладати «Програмування комп’ютерних ігор» за підтримки GSC Game World

Київський політехнічний інститут (КПІ) та найвідоміша українська геймдев-студія GSC Game World, розробник гри S.T.A.L.K.E.R. 2:…

28.11.2025

Хакери модифікували GPT для розробки шкідливих скриптів та проведення фішингових атак

Дослідники Unit42 з Palo Alto Networks проаналізували дві кастомні LLM-моделі, створені на базі GPT: WormGPT…

28.11.2025

Команда мови програмування Zig відмовляється від GitHub на користь Codeberg

Репозиторій мови Zig мігрує з GitHub до Codeberg, некомерційної компанії з хостингу Git, яка базується…

28.11.2025