Alibaba представила сімейство моделей Qwen3. Вони ефективніше працюють з кодом, ніж DeepSeek
Китайська компанія Alibaba представила нову серію моделей з відкритим кодом Qwen3. Як запевняють її розробники, Qwen3 краща за DeepSeek у продуктивності в декількох сферах застосування, в тому числі при роботі з кодом. Нова модель також значно знижує витрати на розгортання, порівняно з іншими основними моделями. Про це повідомляє Bloomberg.
Дві моделі серії Qwen3 включають так звані «змішані моделі експертів» (mixture-of-experts, MoE), які імітують людське мислення. Більшість моделей доступні або скоро будуть доступні для завантаження за відкритою ліцензією на платформах Hugging Face і GitHub. Найменша модель має 0,6 млрд. параметрів, флагманська Qwen3-235B-A22B — до 235 млрд. параметрів.
«Qwen3-235B-A22B досягає конкурентоспроможних результатів у еталонних оцінках кодування, математики, загальних можливостей тощо в порівнянні з іншими моделями вищого рівня, такими як DeepSeek-R1, o1, o3-mini, Grok-3 і Gemini-2.5-Pro», — стверджується в пості Alibaba Qwen на X.
Для розгортання компанія-розробник рекомендує використовувати такі фреймворки, як SGLang і vLLM. Для локального використання — такі інструменти, як Ollama, LMStudio, MLX, llama.cpp і KTransformers. Це гарантує легку інтеграцію Qwen3 у робочі процеси, будь то дослідження, розробка чи продакшн.
Лише кілька тижнів тому Alibaba випустила модель серії Qwen 2.5, яка може обробляти текст, зображення, аудіо та відео. Вона виявилась досить ефективною навіть при роботі безпосередньо на телефонах та ноутбуках.
Компанія Anthropic випустила Claude Code у версії 2.1.0, яка стала помітним оновленням цього популярного інструменту…
Нандіта Гірі, 32-річна програмістка з головного офісу Microsoft у Редмонді поділилась порадами, як розробникам слід…
Одна з найбільших світових аутсорс-компаній EPAM Systems оголосила про стратегічне партнерство з Cursor. Мета співпраці…
Google вносить масштабні зміни в Gmail, інтегруючи в поштовий сервіс можливості штучного інтелекту на базі…
Ілон Маск анонсував значне оновлення LLM-моделі Grok разом із новими продуктами, в тому числі інструментом…
Глава стартапу Replit, який відомий однойменним IDE, Амджад Масад заявив, що інструменти вайб-кодингу змінюють баланс…