Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

США скасовують принцип лотереї при видачі робочих віз H-1B: як це вплине на IT-фахівців

Міністерство внутрішньої безпеки США оголосило про скасування лотерейної системи при видачі іноземним працівникам робочих віз…

24.12.2025

В Україні офіційно затвердили День програміста: коли відзначати нове свято

Кабінет міністрів України погодив Указ президента Володимира Зеленського про появу нового професійного свята — Дня…

24.12.2025

Китай звинуватили в крадіжці у Samsung технології 10-нм DRAM

П'ять осіб, включно з колишніми керівниками та співробітниками Samsung Electronics, були заарештовані в Сеулі за…

24.12.2025

У Києві відбувся форум ветеранських IT-стартапів SKELAR Veteran Venture Program. Фіналісти отримали $44 000

21 грудня 2025 року у Києві відбувся SKELAR Veteran Venture Forum. Після повного циклу акселерації…

24.12.2025

Претендувати на віддалену роботу тепер можуть лише найбільш кваліфіковані співробітники

Сандер ван'т Норденде, генеральний директор компанії Randstad, яка щотижня працевлаштовує близько півмільйона працівників, заявив, що…

24.12.2025

Україна піднялась на 14 позицій у світовому рейтингу розвитку штучного інтелекту

Україна увійшла в Топ-40 світового рейтингу держав за рівнем розвитку штучного інтелекту. Аналітичний центр Oxford…

24.12.2025