Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

«Звичайно, ви можете відмовитись»: GitHub ненав’язливо попереджає, що буде навчати LLM на вашому коді

Вже з 24 квітня 2026 року сервіс хостингу коду GitHub, який належить Microsoft, почне використовувати…

26.03.2026

Що таке медичний турнікет і для чого він потрібен

Сильна кровотеча при травмах кінцівок небезпечна тим, що людина може втратити критичний об’єм крові за…

26.03.2026

Google: до зламу класичного шифрування залишилось три роки

Компанія Google офіційно переглянула свої прогнози щодо настання Q-Day — моменту, коли квантові обчислювальні потужності…

26.03.2026

Платні акаунти ChatGPT та Claude стали затребуваним товаром на підпільних форумах

На підпільних форумах, спільнотах Telegram та маркетплейсах у даркнеті спостерігається стрімка зміна пріоритетів: платні акаунти…

26.03.2026

НАТО роздає мільйони: шукають українські стартапи для розробки технології протидії БПЛА

Український кластер оборонних технологій Brave1 спільно з директоратом інновацій НАТО запускає перший конкурс у рамках…

25.03.2026

Visual Studio Code 1.113: нові теми оформлення, вкладені субагенти та додаткові налаштування ШІ

Microsoft представила свіжий реліз Visual Studio Code 1.113. В оновленні компанія внесла покращення в інтерфейс…

25.03.2026