Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528
Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.
Для навчання M1 використали 512 графічних процесорів Nvidia H800, оренда яких обійшлась у $534 тис.
Модель M1 підтримує довжину контексту в 1 мільйон токенів, що у вісім разів більше, ніж у DeepSeek R1, і вимагає лише близько 30% ресурсів, яких потребує DeepSeek. Журналісти та експерти поки не провели незалежної перевірки заяв MiniMax.
Компанія MiniMax, яка підтримується двома китайськими IT-гігантами Tencent Holdings та Alibaba Group, є частиною елітної групи місцевих стартапів у сфері штучного інтелекту, відомих як Little Dragons. За останній рік вони залучили мільярди доларів венчурного фінансування, хоча зростання DeepSeek змусило більшість групи скоротити або припинити фундаментальні дослідження та зосередитися більше на додатках.
MiniMax заявила, що поділиться додатковими оновленнями протягом наступних кількох днів. Серед інших продуктів компанії — інструмент для створення відео та віртуальний помічник.
Генеральний директор GitHub Томас Домке вважає, що ключем до успіху для розробників в умовах поширення…
Microsoft випустила попередню локальну версію свого пакету офісних програм 365, в рамках заходів щодо дотримання…
Обмеження, запроваджені урядом США проти китайських IT-компаній, призвели до неочікуваних наслідків. Не маючи змоги навчати…
Компанія Apple незабаром надасть розробникам додатків для App Store інструмент для просування додаткових покупок через…
У кожній четвертій IT-вакансії, опублікованій в США цього року, рекрутери вимагають від потенційних кандидатів вміння…
Згідно дослідження Global Tech Ecosystem Index 2025, столиця України увійшла до рейтингу найкращих tech-хабів світу…