Нова модель Qwen-3-Max від Alibaba перевершила GPT-5

Дмитро Сімагін

Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.

Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.

Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.

У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4. 

Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.

Останні статті

Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування

Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та…

07.11.2025

Microsoft Store тепер підтримує створення одного інсталяційного пакета для кількох програм

Компанія Microsoft представила нову функцію в маркетплейсі Microsoft Store, яка дозволяє створювати один інсталяційний пакет…

07.11.2025

Українські топи та фаундери запрошують на The Late Business Show – бізнес-розмову у кінотеатрі

12 листопада у кінотеатрі «Жовтень» відбудеться The Late Business Show by OBRIO — вечір, де…

07.11.2025

Google Cloud розширює функціонал конструктора агентів Vertex AI Agent Builder

Google Cloud оновлює свій конструктор агентів Vertex AI Agent Builder, додавши до нього нові інструменти…

07.11.2025

Microsoft: не надавайте штучному інтелекту доступ до своєї кредитної картки

Компанія Microsoft опублікувала результати випробувань Magentic Marketplace — симуляції торгового майданчика для дослідження можливостей агентів…

07.11.2025

Український стартап-акселератор запускає набір для early-stage компаній з головним призом $10 000

Некомерційна організація AI HOUSE розпочинає реєстрацію на Deep Tech Accelerator: Hardware Edition — non-equity програми…

07.11.2025