Нова модель Qwen-3-Max від Alibaba перевершила GPT-5
Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.
Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.
Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.
У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4.
Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.
Міністерство внутрішньої безпеки США оголосило про скасування лотерейної системи при видачі іноземним працівникам робочих віз…
Кабінет міністрів України погодив Указ президента Володимира Зеленського про появу нового професійного свята — Дня…
П'ять осіб, включно з колишніми керівниками та співробітниками Samsung Electronics, були заарештовані в Сеулі за…
21 грудня 2025 року у Києві відбувся SKELAR Veteran Venture Forum. Після повного циклу акселерації…
Сандер ван'т Норденде, генеральний директор компанії Randstad, яка щотижня працевлаштовує близько півмільйона працівників, заявив, що…
Україна увійшла в Топ-40 світового рейтингу держав за рівнем розвитку штучного інтелекту. Аналітичний центр Oxford…