Мінцифри просить всіх поділитись даними для навчання національної LLM
Мінцифри просить користувачів «увійти в історію» та поділитись текстовими даними для розробки національної LLM. Ці дані потрібні для адаптації моделі до українського контексту, повідомляє сайт міністерства.
Як запевняють представники проекту, майбутня українська LLM стане базою для створення ШІ-помічників у держсекторі та бізнесі.
«Це будуть українські аналоги Gemini та ChatGPT: такі ж зручні та технологічні, але навчені на наших реаліях і контексті», — обіцяють в Мінцифри.
Для навчання LLM потрібні якісні тексти українською мовою. Цікавить такий контент:
- Медіа: новини, інтерв’ю, блоги, публіцистика.
- Наука та освіта: контент курсів, підручники, наукові роботи, дисертації.
- Література: художні твори, критика, рецензії.
- Історія: оцифровані архівні матеріали.
- Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.
Міністерство запевняє, що розуміє цінність інтелектуальної власності авторів. Тому в рамках проекту є готові прозорі юридичні умови, щоб надані матеріали були захищені й працювали винятково на посилення українського штучного інтелекту. Усіх партнерів, які зроблять внесок у розвиток технології, Мінцифри офіційно відзначить в підсумковому звіті про розробку національної LLM-моделі.
Перед завантаженням даних авторів просять розказати про їхній зміст у короткій формі за посиланням. При наявності запитань або потребі в консультації, команда проекту готові відповісти через електронну пошту: [email protected]












Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: