Представлено «найефективнішу» українську LLM-модель Lapa v0.1.2
Дослідники з Українського католицького університету (Львів), AGH University of Krakow, Львівської політехніки та КПІ ім. Ігоря Сікорського, представили публічний реліз україномовної LLM-моделі Lapa.
Версія 0.1.2, яку вже назвали «найефективнішою українською моделлю», має відкритий код, а її робота «узгоджена з національними цінностями», стверджує Центр комунікацій Львівської політехніки. Водночас, в деяких завданнях новинка лише наближається до MamayLM, яка вважається лідером серед українських мовних моделей на сьогодні.
Lapa LLM v0.1.2 має в основі велику мовну модель Gemma-3-12B. Завдяки методу SOTA для адаптації токенізатора вдалося замінити 80 000 токенів з 250 000 на українські без втрати якості моделі, що зробило Lapa LLM найшвидшою моделлю для роботи з українською мовою. Порівняно з оригінальною Gemma 3, для роботи з українською мовою модель вимагає в 1,5 рази менше токенів, таким чином виконуючи втричі менше обчислень.
У тестах на бенчмарках Lapa LLM показала наступні результати:
За словами розробників Lapa LLM, її можна використовувати для таких цілей:
Команда Lapa LLM обіцяє продовжувати роботи над її удосконаленням. Ознайомитись з кодом моделі можна на GitHub.
Нагадаємо, що за даними Мінцифри майбутній чат-бот «Дії» матиме голосовий інтерфейс з підтримкою суржика.
Індійську IT-галузь, в якій працює понад 5 мільйонів людей, накрила хвиля самогубств та масові звільнення,…
Французька компанія Mistral AI оновила свій термінальний агент кодування Mistral Vibe до версії 2.0. Інструмент,…
Мінцифри просить користувачів «увійти в історію» та поділитись текстовими даними для розробки національної LLM. Ці…
Дослідники Koi Security виявили два шкідливих розширення VS Code, які рекламуються як помічники кодування на…
OpenAI випустила текстовий редактор під назвою Prism, в який інтегровано ChatGPT. Інструмент допомагає вченим у…
Кандидати все частіше відмовляються від короткого формату при написанні резюме. Про це йдеться в щорічному…