Рубріки: Новини

Alibaba представила сімейство моделей Qwen3. Вони ефективніше працюють з кодом, ніж DeepSeek

Дмитро Сімагін

Китайська компанія Alibaba представила нову серію моделей з відкритим кодом Qwen3. Як запевняють її розробники, Qwen3 краща за DeepSeek у продуктивності в декількох сферах застосування, в тому числі при роботі з кодом. Нова модель також значно знижує витрати на розгортання, порівняно з іншими основними моделями. Про це повідомляє Bloomberg.

Дві моделі серії Qwen3 включають так звані «змішані моделі експертів» (mixture-of-experts, MoE), які імітують людське мислення. Більшість моделей доступні або скоро будуть доступні для завантаження за відкритою ліцензією на платформах Hugging Face і GitHub. Найменша модель має 0,6 млрд. параметрів, флагманська Qwen3-235B-A22B — до 235 млрд. параметрів.

«Qwen3-235B-A22B досягає конкурентоспроможних результатів у еталонних оцінках кодування, математики, загальних можливостей тощо в порівнянні з іншими моделями вищого рівня, такими як DeepSeek-R1, o1, o3-mini, Grok-3 і Gemini-2.5-Pro», — стверджується в пості Alibaba Qwen на X. 

Для розгортання компанія-розробник рекомендує використовувати такі фреймворки, як SGLang і vLLM. Для локального використання — такі інструменти, як Ollama, LMStudio, MLX, llama.cpp і KTransformers. Це гарантує легку інтеграцію Qwen3 у робочі процеси, будь то дослідження, розробка чи продакшн.

Лише кілька тижнів тому Alibaba випустила модель серії Qwen 2.5, яка може обробляти текст, зображення, аудіо та відео. Вона виявилась досить ефективною навіть при роботі безпосередньо на телефонах та ноутбуках.

Останні статті

Співробітники Xiaomi скаржаться на 15-годинний робочий день і штрафи за вихідні

У соцмережі Maimai, яку можна назвати китайським аналогом LinkedIn, поширився пост про те, що Xiaomi…

29.04.2025

JetBrains оновлює AI Assistant і робить безкоштовними всі функції штучного інтелекту в IDE

Компанія JetBrains випустила значне оновлення своїх функцій штучного інтелекту та запровадила новий безкоштовний рівень доступу.…

29.04.2025

GNU Compiler Collection 15.1 отримав підтримку COBOL та ранню підтримку Rust

У новий реліз набору компіляторів для різних мов програмування GCC (GNU Compiler Collection) 15.1 вперше…

29.04.2025

OpenAI додає в ChatGPT функцію покупок і підказки під час введення тексту

Компанія OpenAI оголосила про значне оновлення пошуку в ChatGPT. Тепер користувачі зможуть шукати товари та…

29.04.2025

У Microsoft прогнозують, що у майбутньому кожна людина стане начальником. Це пов’язано з розвитком ШІ

У Microsoftупевнені, що у майбутньому кожна людина стане начальником завдяки розвитку штучного інтелекту, повідомили в iLenta.…

28.04.2025

В «Резерв+» в травні з’являться два нові види відстрочок

В травні планується розширення функціоналу застосунку «Резерв+», в межах якого буде додано два нові типи…

28.04.2025