Французька компанія Mistral AI запускає Forge — корпоративну платформу для створення LLM «з нуля» та подальшого навчання моделі на власних даних. Теоретично, ця пропозиція може зацікавити фінансовий та державний сектор, яким треба повністю контролювати систему та надавати публічні послуги з урахуванням місцевого законодавства.
Навчання LLM може проходити на власних кластерах Mistral, на Mistral Compute (спеціалізованій інфраструктурній пропозиції компанії) або повністю локально у власних центрах обробки даних клієнта.
Mistral Forge є альтернативою для розробки LLM власними силами на базі відкритих моделей. Нагадаємо, що Мінцифри України спільно з «Київстар» вже кілька місяців працюють над навчанням «національної LLM», яка базується на моделі Google Gemma 3. У загальному рейтингу Hugging Face Gemma 3-27b займає 120 місце. Найпотужніша модель серії Mistral 3 — 59 місце.
Поява Forge дозволяє вийти за рамки API для точного налаштування LLM, які Mistral та її конкуренти пропонували в минулому році. Платформа підтримує повний життєвий цикл навчання моделі:
«У нас був API для точного налаштування… Але щоразу, коли ви справді хочете отримати бажану продуктивність, вам потрібно вийти за рамки. Сьогодні дослідники штучного інтелекту не використовують API для точного налаштування. Вони використовують набагато просунутіші інструменти, і саме це пропонує Forge», — пояснює Еліза Саламанка, керівник відділу продуктів Mistral AI.
На відміну від OpenAI чи Anthropic, Mistral не стягує плату за обчислення. Натомість компанії доведаться заплатити ліцензійний збір за саму платформу Forge, а також додаткову плату за послуги конвеєра даних. Також доведеться оплатити послуги ШІ-дослідників Mistral, які працюватимуть з командою клієнта.
«Жоден конкурент сьогодні не продає цей вбудований науковий модуль як частину своєї навчальної платформи», — заявила Саламанка.
Пропозиція надавати консультативні послуги з налаштування свідчить про те, що Mistral визнає фундаментальну істину про сучасний стан корпоративного штучного інтелекту: однієї лише технології недостатньо. Більшості організацій бракує внутрішньої експертизи для розробки ефективних рецептів навчання та обробки даних у великих масштабах на графічних процесорах.
Раніше ми писали, що згідно дослідження Jellyfish, штучний інтелект подвоює обсяг готового коду, при цьому якість залишається на високому рівні.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Епоха затишних гаражів, де колись народжувалися технологічні гіганти на кшталт Apple чи Google, остаточно відходить…
Дослідження, проведене платформою програмної аналітики Jellyfish, підтвердило, що впровадження штучного інтелекту стало поширеним явищем у…
Nvidia анонсувала DLSS 5 — модель нейронного рендерингу в реальному часі, яку обіцяють випустити цієї…
В інтерфейсі чат-боту Google Gemini з'явилось розгалуження діалогів. Ця функція дозволяє користувачам створювати паралельні гілки…
За даними Інтерполу, схеми фінансового шахрайства, де використовуються інструменти штучного інтелекту, дають злочинцям у 4,5…
Створення візуальних заміток у Windows 11 стане значно простішим, оскільки Microsoft активно тестує підтримку зображень…