Рубріки: Новини

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Дмитро Сімагін

Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.

Для навчання M1 використали 512 графічних процесорів Nvidia H800, оренда яких обійшлась у $534 тис.

Модель M1 підтримує довжину контексту в 1 мільйон токенів, що у вісім разів більше, ніж у DeepSeek R1, і вимагає лише близько 30% ресурсів, яких потребує DeepSeek. Журналісти та експерти поки не провели незалежної перевірки заяв MiniMax.

Компанія MiniMax, яка підтримується двома китайськими IT-гігантами Tencent Holdings та Alibaba Group, є частиною елітної групи місцевих стартапів у сфері штучного інтелекту, відомих як Little Dragons. За останній рік вони залучили мільярди доларів венчурного фінансування, хоча зростання DeepSeek змусило більшість групи скоротити або припинити фундаментальні дослідження та зосередитися більше на додатках.

MiniMax заявила, що поділиться додатковими оновленнями протягом наступних кількох днів. Серед інших продуктів компанії — інструмент для створення відео та віртуальний помічник.

 

Останні статті

Нотаріальна палата України звинуватила сервіс «е-Нотаріат» у витоку даних громадян. Мінцифри заперечує

Нотаріальна палата України опублікувала відкритий лист №41/3 від 18.09.2025 до першого віцепрем’єр-міністра та міністра цифрової трансформації…

18.09.2025

Топ-менеджер xAI запевнив підлеглих, що звільнень більше не буде, і потім звільнив ще 100 фахівців

15 вересня керівник команди навчання Grok у компанії xAI Дієго Пасіні запевнив підлеглих, що тепер…

18.09.2025

Українська IT-компанія презентувала онбординг співробітників у метавсесвіті — як це працює

Українська компанія Kiss My Apps разом із LEZO представила онбординг для співробітників у метавсесвіті. Це…

18.09.2025

«Стягнули $1000 тільки на цьому тижні»: вайб-кодери шоковані тарифами Replit Agent 3

Сервіс вайб-кодингу Replit зіткнувся зі скаргами користувачів, яким довелось попрацювати з найновішою версією помічника з…

18.09.2025

Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4

Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch.…

18.09.2025

Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв’язавши 10 з 12 завдань

Компанія Google заявила, що її LLM-модель виграла світовий фінал Міжнародного конкурсу коледжів з програмування (ICPC),…

18.09.2025