logo

Приєднуйтесь до нас

Новини 27/10/2025 11:40

Представлено «найефективнішу» українську LLM-модель Lapa v0.1.2

Дмитро Сімагін

Журналіст

Дослідники з Українського католицького університету (Львів), AGH University of Krakow, Львівської політехніки та КПІ ім. Ігоря Сікорського, представили публічний реліз україномовної LLM-моделі Lapa. 

Версія 0.1.2, яку вже назвали «найефективнішою українською моделлю», має відкритий код, а її робота «узгоджена з національними цінностями», стверджує Центр комунікацій Львівської політехніки. Водночас, в деяких завданнях новинка лише наближається до MamayLM, яка вважається лідером серед українських мовних моделей на сьогодні.

Lapa LLM v0.1.2 має в основі велику мовну модель Gemma-3-12B. Завдяки методу SOTA для адаптації токенізатора вдалося замінити 80 000 токенів з 250 000 на українські без втрати якості моделі, що зробило Lapa LLM найшвидшою моделлю для роботи з українською мовою. Порівняно з оригінальною Gemma 3, для роботи з українською мовою модель вимагає в 1,5 рази менше токенів, таким чином виконуючи втричі менше обчислень.

У тестах на бенчмарках Lapa LLM показала наступні результати:

  • Переклад: модель досягла 33 BLEU на FLORES для напряму англійська → українська та навпаки.
  • Обробка зображень: у тесті MMZNO Lapa LLM увійшла до лідерів серед моделей свого класу за точністю розпізнавання україномовних підписів та описів зображень.
  • Summarization і Q&A: продемонструвала стабільну роботу з великими текстами, збереження контексту й точність у відповіді на запитання — рівень, придатний для систем типу RAG.
  • Виявлення пропаганди: модель показала послідовність у визначенні маніпулятивних наративів та упереджених формулювань, що підтверджує якість фільтрації даних під час претрейнінгу.

За словами розробників Lapa LLM, її можна використовувати для таких цілей:

  • створення корпоративних асистентів і чат-ботів українською мовою;
  • машинного перекладу між українською та англійською;
  • побудови RAG-рішень для внутрішніх документів;
  • роботи з конфіденційними текстами без передавання їх на зовнішні сервери.

Команда Lapa LLM обіцяє продовжувати роботи над її удосконаленням. Ознайомитись з кодом моделі можна на GitHub.

Нагадаємо, що за даними Мінцифри майбутній чат-бот «Дії» матиме голосовий інтерфейс з підтримкою суржика.

Головна > Новини > Представлено «найефективнішу» українську LLM-модель Lapa v0.1.2

Найбільш обговорювані статті

Windows 11 таємно робить скріншоти, коли ви граєте у відеоігриWindows 11 таємно робить скріншоти, коли ви граєте у відеоігри
JetBrains: для 90% програмістів інструменти ШІ економлять мінімум годину на тиждень, для 20% — цілий робочий деньJetBrains: для 90% програмістів інструменти ШІ економлять мінімум годину на тиждень, для 20% — цілий робочий день
Інструмент кодування Claude Code тепер доступний у веб- та мобільній версіїІнструмент кодування Claude Code тепер доступний у веб- та мобільній версії
Підшуючи жертв серед розробників, хакери маскуються під рекрутерівПідшукуючи жертв серед розробників, хакери маскуються під рекрутерів
«12 тисяч кандидатів і лише 300 вакансій». Фронтенд в українському IT залишається найбільш конкурентною категорією«12 тисяч кандидатів і лише 300 вакансій». Фронтенд в українському IT залишається найбільш конкурентною категорією
Ілон Маск викликав на дуель з програмування співзасновника OpenAI Андрея КарпатиІлон Маск викликав на дуель з програмування співзасновника OpenAI Андрея Карпати
JetBrains додає нові функції в середовище .NET-розробки RiderJetBrains додає нові функції в середовище .NET-розробки Rider
OpenAI представила браузер ChatGPT Atlas — альтернативу Google Chrome з пам'яттю та агентамиOpenAI представила браузер ChatGPT Atlas — альтернативу Google Chrome з пам’яттю та агентами
Google розширює можливості вайб-кодингу на платформі AI StudioGoogle розширює можливості вайб-кодингу на платформі AI Studio
OpenAI готується до релізу GPT-4.1

Grok 4 стає безкоштовною, разом з генератором відео

Китайські IT-компанії перевозять жорсткі диски у валізах. Причина в штучному інтелекті

Нова LLM-модель Grok Code Fast 1 бреше про результати своєї роботи

Meta випустила оптимізовану для кодування модель Code World Model

«Meta в режимі паніки»: Цукерберг створив 4 робочі групи для вивчення причин успіху DeepSeek

OpenAI готує до релізу модель o3-pro. Вона найпотужніша для кодування, але коштує $200

Інсайдер з Microsoft розповів про дати виходу моделей GPT-4.5 і GPT-5

DeepSeek-R1 може генерувати шкідливий код — дослідники

Успіх DeepSeek-R1 ставить під загрозу багатомільярдну індустрію OpenAI

Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію

Meta випустила «економну» ШІ-модель Llama 3.3 з відкритим кодом

GPT-5 виявилась «найпотужнішою для кодування», однак багато хто сподівався на краще

Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель

Google випустила мобільний додаток для локального запуску LLM-моделей на смартфоні

Devstral — нова LLM-модель з відкритим кодом, створена спеціально для розробки ПЗ

ChatGPT o3 відмовилась відключати себе, незважаючи на інструкцію розробника

«Це небезпечно». Марк Цукерберг пояснив, чому Meta не відкриє код своїх моделей «суперінтелекту»

Google випустила модель міркування Gemini Deep 2.5 Think, яка одночасно тестує кілька ідей

DeepSeek випускає Janus-Pro — генератор зображень, який конкурує з OpenAI DALL-E 3

OpenAI підвищує ліміти використання ChatGPT і повертає «застарілу» модель GPT-4o

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

OpenAI випустила GPT-OSS — першу LLM-модель з відкритим кодом з часів GPT-2

Сем Альтман обіцяє надати всім безкоштовний доступ до GPT-5

Топ текстів
Новини - 1 місяць назад
Резерв+ знову оновлено: онлайн-реєстрація 17-річних і автоматичний військовий облік
Новини - 1 місяць назад
Meta випустила оптимізовану для кодування модель Code World Model
Спецпроєкти - 4 тижні назад
Відкрита реєстрація на курс «Розвивайте кар’єру із Google Cloud». Для новачків в ІТ – індивідуальні консультації
Спецпроєкти - 2 тижні назад
Є і буде завжди: як працювати з невизначеністю? Досвід у FAVBET Tech
Спецпроєкти - 2 тижні назад
Технічний рекрутинг у FAVBET Tech: як перевіряють кандидатів і чим тут допомагає ШІ
Новини - 1 місяць назад
Microsoft: «заради уникнення катастрофи» штучний інтелект повинні контролювати військові
Новини - 1 місяць назад
Google запускає в Україні пільговий тарифний план Google AI Plus
Спецпроєкти - 1 тиждень назад
П’ять пасток, у які потрапляють навіть досвідчені проджект-менеджери. Колонка FAVBET Tech
Новини - 1 місяць назад
Rust може стати обов’язковою залежністю в Git 3.0
Новини - 1 місяць назад
Платформу вайб-кодингу VibeSDK від CloudFlare перевели в open source

Новини

Стартапи в США переходять на 6-денний графік через конкуренцію з Китаєм

 27.10.2025 17:37

Manual QA в Україні: кандидатів стає менше, вакансій побільшало

 27.10.2025 15:46

У LLM-моделей з'явився «інстинкт самозбереження». Вчені вважають це небезпечним

 27.10.2025 12:33

Представлено «найефективнішу» українську LLM-модель Lapa v0.1.2

 27.10.2025 11:40

Розробники тепер можуть створювати Android-програми на мові Swift

 27.10.2025 09:14

Microsoft додає в Copilot групи з підтримкою до 32 учасників, режим репетитора Learn Live та анімованого помічника

 24.10.2025 17:05

У Google Meet з'явились «кімнати очікування»

 24.10.2025 15:34

ChatGPT тепер може аналізувати внутрішні корпоративні дані

 24.10.2025 12:44

PyTorch представляє Monarch — фреймворк для програмування на тисячах комп'ютерів

 24.10.2025 11:40

Агент Cursor врятував розробника від хакера, який видавав себе за українця

 24.10.2025 09:45

Спецпроєкти

FAVBET Tech сплатив понад 650 млн грн податків за 9 місяців 2025 року
Технічний рекрутинг у FAVBET Tech: як перевіряють кандидатів і чим тут допомагає ШІ
П’ять пасток, у які потрапляють навіть досвідчені проджект-менеджери. Колонка FAVBET Tech
Топ текстів тижня
1.
Розробник побив власний рекорд, написавши гру «Змійка» розміром усього 54 байти
2.
Windows 11 таємно робить скріншоти, коли ви граєте у відеоігри
3.
Ілон Маск викликав на дуель з програмування співзасновника OpenAI Андрея Карпати
4.
Новий браузер ChatGPT Atlas можна легко обдурити за допомогою prompt injection
5.
Підшукуючи жертв серед розробників, хакери маскуються під рекрутерів
6.
Агент Cursor врятував розробника від хакера, який видавав себе за українця
7.
«12 тисяч кандидатів і лише 300 вакансій». Фронтенд в українському IT залишається найбільш конкурентною категорією
8.
PyTorch представляє Monarch — фреймворк для програмування на тисячах комп’ютерів
9.
OpenAI представила браузер ChatGPT Atlas — альтернативу Google Chrome з пам’яттю та агентами
10.
Безпілотники, AI та антидроновий захист: Топ розробок IT-компанії Favbet Tech для оборони країни

Ваша жалоба отправлена модератору

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

Користні рішення для тих,
хто пише код

Приєднуйтесь
до товариства: