Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

10 причин, чому ця криптозима буде найгіршою в історії (штучний інтелект теж звинуватили)

Біткоїн використав усі причини та пояснення, які протягом багатьох років спонукали людей вкладати гроші в…

06.02.2026

Meta розробляє власний аналог TikTok: як він виглядатиме

Компанія Meta розробляє окремий додаток, інтерфейс якого дуже схожий на TikTok. Майбутня програма під назвою…

06.02.2026

Редактор коду VS Code 1.109 отримав підтримку паралельного керування кількома сеансами агентів

Microsoft оновила свій багатофункціональний редактор коду Visual Studio Code. Версія VS Code 1.109, за твердженням…

06.02.2026

Португальська компанія TEKEVER шукає фахівців з розробки безпілотних систем для команди в Україні

Компанія TEKEVER, провідний європейський постачальник безпілотних авіаційних систем з використанням штучного інтелекту, відкриває нові інженерні…

06.02.2026

OpenAI випустила GPT-5.3-Codex: на 25% швидше пише код і виконує «будь-які» завдання замість розробників

Компанія OpenAI випустила модель для агентного кодування GPT-5.3-Codex — майже одразу після релізу Claude Opus…

06.02.2026

Anthropic випустила Claude Opus 4.6 з підтримкою довгого контексту

Anthropic оголосила про реліз Claude Opus 4.6, яка, за словами компанії, є її найпотужнішою моделлю…

06.02.2026