Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

Хакери знову атакують Python-розробників, пропонуючи фейковий сайт PyPi

Python Software Foundation (PSF) попереджає користувачів про нову серію фішингових атак з використанням фейкового веб-сайту…

25.09.2025

Куди інвестують українці у 2025 році?

У новій економічній реальності українці дедалі активніше переосмислюють підходи до заощаджень і примноження капіталу. В…

25.09.2025

OpenAI тестує агента GPT-Alpha. Він буде самостійно писати, запускати та налагоджувати код

OpenAI проводить внутрішнє тестування нової версії агента, який використовує спеціальну версію GPT-5 під назвою GPT-Alpha.…

25.09.2025

Програмісти не цікавляться мобільним вайб-кодингом, незважаючи на наявність спеціалізованого софту

Технологія вайб-кодингу на мобільних пристроях поки не набула масового поширення. Незважаючи на численні спеціалізовані додатки,…

24.09.2025

Дві третини команд розробників використовують ШІ-інструменти, але продуктивність зросла лише на 10-15% — дослідження

Генеративний штучний інтелект у розробці програмного забезпечення не виправдовує того ажіотажу, який здійнявся навколо нього.…

24.09.2025

Google запускає в Україні пільговий тарифний план Google AI Plus

Компанія Google Україна запустила новий тарифний план Google AI Plus. Відтепер користувачі в Україні отримають…

24.09.2025