Рубріки: Новини

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Дмитро Сімагін

Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.

Для навчання M1 використали 512 графічних процесорів Nvidia H800, оренда яких обійшлась у $534 тис.

Модель M1 підтримує довжину контексту в 1 мільйон токенів, що у вісім разів більше, ніж у DeepSeek R1, і вимагає лише близько 30% ресурсів, яких потребує DeepSeek. Журналісти та експерти поки не провели незалежної перевірки заяв MiniMax.

Компанія MiniMax, яка підтримується двома китайськими IT-гігантами Tencent Holdings та Alibaba Group, є частиною елітної групи місцевих стартапів у сфері штучного інтелекту, відомих як Little Dragons. За останній рік вони залучили мільярди доларів венчурного фінансування, хоча зростання DeepSeek змусило більшість групи скоротити або припинити фундаментальні дослідження та зосередитися більше на додатках.

MiniMax заявила, що поділиться додатковими оновленнями протягом наступних кількох днів. Серед інших продуктів компанії — інструмент для створення відео та віртуальний помічник.

 

Останні статті

Lazarus Group змінює тактику. Тепер хакери націлені на програмістів, які володіють криптовалютою

Північнокорейські хакери Lazarus Group змінили тактику. Тепер замість атак на банки та криптовалютні біржі вони…

04.08.2025

Apple розробляє спрощений чат-бот, який конкуруватиме з ChatGPT

Хоча Apple значно відстає в сфері розробки штучного інтелекту, цілком можливо, ця ситуація незабаром зміниться.…

04.08.2025

Лайв-кодинг шкодить найму програмістів — дослідження Microsoft

Дослідження Microsoft доводить, що лайв-кодинг — не найкращий спосіб оцінити реальні навички кандидата. Навпаки, він…

04.08.2025

OpenAI відключили від Claude API. Anthropic не хоче, щоб її інструменти використовували для покращення GPT-5

Компанія Anthropic обмежила співробітникам OpenAI доступ до Claude Code через API після того, як дізналася,…

04.08.2025

Дослідник штучного інтелекту відхилив оффер на $1 мільярд від Цукерберга

Марк Цукерберг не залишає спроб зібрати в своїй компанії найкращих фахівців з розробки штучного інтелекту.…

04.08.2025

Diia.City United закликала Верховну Раду врахувати потреби бізнесу й внести зміни в Defence City

Diia.City United закликає ґрунтовно переробити законопроєкт «Defence City» та під час другого читання врахувати потреби…

01.08.2025