Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

Архівувати дані все складніше: HDD подорожчали, сайти блокують пошукових ботів

Організації, які займаються архівуванням інтернет-даних, опинилися під подвійним тиском: ціни на накопичувачі злетіли через попит…

08.05.2026

З відеокартою Nvidia RTX 5090 можна зламати 60% паролів менш ніж за годину

60% паролів, захищених алгоритмом MD5, можна зламати менш ніж за годину за допомогою однієї відеокарти…

08.05.2026

OpenAI додає Codex у Chrome: тепер це однозначно головний конкурент Claude Code

Компанія OpenAI офіційно випустила розширення Codex для браузера Google Chrome, що стало важливим кроком у…

08.05.2026

КНУ імені Шевченка зняв заборону на Telegram: що змусило ректора змінити рішення

Київський національний університет імені Тараса Шевченка розблокував Telegram у своїй внутрішній мережі. Ректор підписав відповідний…

08.05.2026

Хто в Україні вміє впроваджувати CRM: з’явився перший незалежний рейтинг інтеграторів

Кожна п'ята українська компанія, яка використовує CRM, досі робить це за допомогою російського софту. А…

08.05.2026

40% розробників C++ використовують штучний інтелект, але довіра до нього залишається низькою — опитування

Щорічне опитування Standard C++ Foundation зафіксувало стрімке зростання використання штучного інтелекту серед C++-розробників — однак…

08.05.2026