Рубріки: Новини

Alibaba представила сімейство моделей Qwen3. Вони ефективніше працюють з кодом, ніж DeepSeek

Дмитро Сімагін

Китайська компанія Alibaba представила нову серію моделей з відкритим кодом Qwen3. Як запевняють її розробники, Qwen3 краща за DeepSeek у продуктивності в декількох сферах застосування, в тому числі при роботі з кодом. Нова модель також значно знижує витрати на розгортання, порівняно з іншими основними моделями. Про це повідомляє Bloomberg.

Дві моделі серії Qwen3 включають так звані «змішані моделі експертів» (mixture-of-experts, MoE), які імітують людське мислення. Більшість моделей доступні або скоро будуть доступні для завантаження за відкритою ліцензією на платформах Hugging Face і GitHub. Найменша модель має 0,6 млрд. параметрів, флагманська Qwen3-235B-A22B — до 235 млрд. параметрів.

«Qwen3-235B-A22B досягає конкурентоспроможних результатів у еталонних оцінках кодування, математики, загальних можливостей тощо в порівнянні з іншими моделями вищого рівня, такими як DeepSeek-R1, o1, o3-mini, Grok-3 і Gemini-2.5-Pro», — стверджується в пості Alibaba Qwen на X. 

Для розгортання компанія-розробник рекомендує використовувати такі фреймворки, як SGLang і vLLM. Для локального використання — такі інструменти, як Ollama, LMStudio, MLX, llama.cpp і KTransformers. Це гарантує легку інтеграцію Qwen3 у робочі процеси, будь то дослідження, розробка чи продакшн.

Лише кілька тижнів тому Alibaba випустила модель серії Qwen 2.5, яка може обробляти текст, зображення, аудіо та відео. Вона виявилась досить ефективною навіть при роботі безпосередньо на телефонах та ноутбуках.

Останні статті

Україна обирає представника для глобального фіналу Startup World Cup 2026 у Кремнієвій долині

Українські технологічні проєкти мають шанс заявити про себе на світовій арені. Відкрито прийом заявок на…

24.04.2026

Microsoft шукає «добровольців» на звільнення: пропонують річну зарплату, але не всім

Корпорація Microsoft пропонує частині своїх досвідчених співробітників у США залишити посаду добровільно, запроваджуючи програму викупу…

24.04.2026

DeepSeek випускає нову модель V4 Pro. Вона має 1,6 трильйона параметрів і дуже дешева

Китайська компанія DeepSeek представила свій новий флагман — LLM-модель DeepSeek-V4. Рівно через рік після свого…

24.04.2026

Audi та Volkswagen переходять на китайський штучний інтелект: Alibaba Qwen лідирує

Китайський технологічний гігант Alibaba оголосив про масштабне розширення своєї присутності на ринку електроавтомобілів. Велика мовна…

24.04.2026

Вайб-воркінг: Microsoft дозволить агентам працювати за вас у Word та Excel

Компанія Microsoft розширює застосування концепції під назвою Vibe Working (вайб-воркінг) та спеціального режиму роботи Agent…

24.04.2026

OpenAI повертає лідерство: GPT-5.5 випередила Claude Opus 4.7 у ключовому бенчмарку Terminal-Bench 2.0

Компанія OpenAI представила GPT-5.5 — нову LLM-модель, орієнтовану на виконання складних багатоетапних завдань з мінімальним…

24.04.2026