Рубріки: Новини

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Дмитро Сімагін

Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.

Для навчання M1 використали 512 графічних процесорів Nvidia H800, оренда яких обійшлась у $534 тис.

Модель M1 підтримує довжину контексту в 1 мільйон токенів, що у вісім разів більше, ніж у DeepSeek R1, і вимагає лише близько 30% ресурсів, яких потребує DeepSeek. Журналісти та експерти поки не провели незалежної перевірки заяв MiniMax.

Компанія MiniMax, яка підтримується двома китайськими IT-гігантами Tencent Holdings та Alibaba Group, є частиною елітної групи місцевих стартапів у сфері штучного інтелекту, відомих як Little Dragons. За останній рік вони залучили мільярди доларів венчурного фінансування, хоча зростання DeepSeek змусило більшість групи скоротити або припинити фундаментальні дослідження та зосередитися більше на додатках.

MiniMax заявила, що поділиться додатковими оновленнями протягом наступних кількох днів. Серед інших продуктів компанії — інструмент для створення відео та віртуальний помічник.

 

Останні статті

Amazon викрила IT-фахівця з КНДР завдяки мілісекундам затримки при натисканні клавіатури

Північнокорейського самозванця, який віддалено працював системним адміністратором в американському Amazon, викрили після того, як затримка…

19.12.2025

В українському IT на третину поменшало початківців

Вітчизняна IT-галузь демонструє ознаки повільного зростання після суттєвого падіння показників у 2022-23 роках. Наприкінці 2025…

19.12.2025

Після обурення спільноти GitHub відмовляється від плану стягувати плату за self-hosted раннери

Не минуло й двох діб після того, як GitHub оголосив про запровадження з 1 березня…

19.12.2025

JetBrains випустила Kotlin 2.3.0. Реліз має експериментальні функції та підтримку Java 25

JetBrains випустила загальнодоступне останнє оновлення мови програмування Kotlin 2.3.0. Новий реліз має низку експериментальних функцій,…

19.12.2025

Нову модель GPT-5.2-Codex від OpenAI названо «найдосконалішим інструментом для реальної розробки»

Компанія OpenAI офіційно представила GPT-5.2-Codex — нову модель, яку названо «найдосконалішим інструментом для реальної розробки…

19.12.2025

Мінфін все ж таки готується ввести ПДВ для ФОП третьої групи

Міністерство фінансів України опублікувало законопроект про введення ПДВ для ФОП 1-3 груп. Прогнозується, що нові…

18.12.2025