Нова модель Qwen-3-Max від Alibaba перевершила GPT-5
Компанія Alibaba офіційно випустила Qwen-3-Max — свою найпотужнішу модель, яка до цього часу була доступна в preview-статусі. Протестувати LLM-модель через чат-бот можна безкоштовно на офіційному сайті, пише The Decoder.
Qwen-3 Max має 1 трильйон параметрів, вона навчена на масиві даних об’ємом 36 трлн токенів. Контекстне вікно досягає 1 млн токенів, що дозволяє аналізувати цілі кодові бази та багатотомні документи без поділу тексту.
Alibaba стверджує, що Qwen-3 Max забезпечує більш високу точність у завданнях, пов’язаних з математикою, програмуванням, логікою та наукою. У рейтингу LMArena нова модель у версії Qwen3-Max-Instruct посідає третє місце, випередивши базову версію GPT-5. З увімкненим параметром Remove Style Control модель Qwen-3 Max зайняла друге місце, поступившись лише Gemini 2.5 Pro.
У тесті SWE-Bench Verified, що перевіряє здатність вирішувати реальні завдання програмування, Qwen-3 Max набрала 69,6 балів. Це більше, ніж DeepSeek V3.1, але трохи менше, ніж Claude Opus 4.
Зараз Alibaba працює над новою версією Qwen-3-Max-Thinking, яка знаходиться на стадії навчання, але вже демонструє «видатний потенціал». Зокрема, у пробних тестах вона показала стовідсотковий результат у завданнях на міркування, включаючи AIME-25 та HMMT.
Вже з 24 квітня 2026 року сервіс хостингу коду GitHub, який належить Microsoft, почне використовувати…
Сильна кровотеча при травмах кінцівок небезпечна тим, що людина може втратити критичний об’єм крові за…
Компанія Google офіційно переглянула свої прогнози щодо настання Q-Day — моменту, коли квантові обчислювальні потужності…
На підпільних форумах, спільнотах Telegram та маркетплейсах у даркнеті спостерігається стрімка зміна пріоритетів: платні акаунти…
Український кластер оборонних технологій Brave1 спільно з директоратом інновацій НАТО запускає перший конкурс у рамках…
Microsoft представила свіжий реліз Visual Studio Code 1.113. В оновленні компанія внесла покращення в інтерфейс…