Рубріки: Новини

Alibaba представила сімейство моделей Qwen3. Вони ефективніше працюють з кодом, ніж DeepSeek

Дмитро Сімагін

Китайська компанія Alibaba представила нову серію моделей з відкритим кодом Qwen3. Як запевняють її розробники, Qwen3 краща за DeepSeek у продуктивності в декількох сферах застосування, в тому числі при роботі з кодом. Нова модель також значно знижує витрати на розгортання, порівняно з іншими основними моделями. Про це повідомляє Bloomberg.

Дві моделі серії Qwen3 включають так звані «змішані моделі експертів» (mixture-of-experts, MoE), які імітують людське мислення. Більшість моделей доступні або скоро будуть доступні для завантаження за відкритою ліцензією на платформах Hugging Face і GitHub. Найменша модель має 0,6 млрд. параметрів, флагманська Qwen3-235B-A22B — до 235 млрд. параметрів.

«Qwen3-235B-A22B досягає конкурентоспроможних результатів у еталонних оцінках кодування, математики, загальних можливостей тощо в порівнянні з іншими моделями вищого рівня, такими як DeepSeek-R1, o1, o3-mini, Grok-3 і Gemini-2.5-Pro», — стверджується в пості Alibaba Qwen на X. 

Для розгортання компанія-розробник рекомендує використовувати такі фреймворки, як SGLang і vLLM. Для локального використання — такі інструменти, як Ollama, LMStudio, MLX, llama.cpp і KTransformers. Це гарантує легку інтеграцію Qwen3 у робочі процеси, будь то дослідження, розробка чи продакшн.

Лише кілька тижнів тому Alibaba випустила модель серії Qwen 2.5, яка може обробляти текст, зображення, аудіо та відео. Вона виявилась досить ефективною навіть при роботі безпосередньо на телефонах та ноутбуках.

Останні статті

CEO GitHub Томас Домке застерігає розробників: «Або прийміть штучний інтелект, або забудьте про цю роботу»

Генеральний директор GitHub Томас Домке звернувся із застереженням до розробників програмного забезпечення: «Адаптуйтеся до штучного…

05.08.2025

ChatGPT тепер нагадуватиме про необхідність перерв у роботі

Чат-бот ChatGPT почав відображати користувачам ненав’язливі нагадування під час тривалих сеансів, щоб заохотити зробити перерву.…

05.08.2025

У липні українські IT-компанії опублікували понад 7 тисяч вакансій — це рекорд з 2022 року

Українська IT-галузь демонструє ознаки покращення, принаймні в сфері працевлаштування. За даними jobs.dou.ua, у липні 2025…

05.08.2025

Багхантер на базі штучного інтелекту від Google самостійно виявив 20 вразливостей у відкритому ПЗ

Система штучного інтелекту Big Sleep від компанії Google вперше самостійно виявила 20 вразливостей у відкритому…

05.08.2025

Google розробила новий шрифт для програмістів

Компанія Google представила новий шрифт Sans Code, спеціально створений для програмістів. Він поєднує «геометричну точність…

05.08.2025

Lazarus Group змінює тактику. Тепер хакери націлені на програмістів, які володіють криптовалютою

Північнокорейські хакери Lazarus Group змінили тактику. Тепер замість атак на банки та криптовалютні біржі вони…

04.08.2025