Рубріки: Новини

«Краще, ніж DeepSeek і OpenAI»: ​​Alibaba випустила модель з відкритим кодом, яка дешевше конкурентів

Дмитро Сімагін

Компанія Alibaba представила QwQ-32B — нову модель з відкритим кодом з сімейства великих мовних моделей Qwen. Як стверджують її розробники, вона перевершує продуктивність конкурентів: DeepSeek-R1 і o1-mini, незважаючи на  свої відносно скромні 32 мільярди параметрів. Про це пише Venture Beat.

Команда, яка працювала над створенням QwQ-32B, запевняє, що менша кількість параметрів дозволяє моделі працювати з меншими вимогами до обчислювальних ресурсів, що сприяє більш широкому застосуванню.

Наприклад, у той час як DeepSeek-R1 має 671 мільярд параметрів, QwQ-32B досягає схожої продуктивності з набагато меншими ресурсами. Вона вимагає лише 24 ГБ відеопам’яті на графічному процесорі (Nvidia H100 має 80 ГБ) у порівнянні з понад 1500 ГБ відеопам’яті для повноцінної роботи DeepSeek R1 (16 відеокарт Nvidia A100). Це підкреслює ефективність використання QwQ-32B. 

Модель вже доступна на Hugging Face і ModelScope. Оскільки вона має ліцензію Apache 2.0, це означає, що QwQ-32B може безкоштовно використовуватись для будь-яких комерційних і дослідницьких цілей.

Першу модель сімейства QwQ (скорочення від Qwen-with-Questions), було представлено в листопаді 2024 року. Спочатку ранні ітерації QwQ не вразили експертів, оскільки моделі мали проблеми з тестами програмування, такими як LiveCodeBench, де розробки OpenAI зберігали перевагу. 

Останні статті

Користувачі Google Meet тепер можуть приєднуватися до дзвінків Microsoft Teams

Google додає сумісність сервісу відеодзвінків Google Meet з платформою Microsoft Teams. Це означає, що тепер…

04.02.2026

Кіберполіція затримала групу злочинців, які обкрадали українські банки через POS-термінали

Співробітники Департаменту кіберполіції спільно зі слідчими ГСУ НП України, за процесуального керівництва Офісу Генпрокурора та…

04.02.2026

GitHub готує автоматичне рішення для боротьби з низькоякісними пул-реквестами

Менеджер з продуктів GitHub Камілла Мораес відкрила обговорення «критичної проблеми, яка впливає на спільноту open…

04.02.2026

Російські військові образились на Ілона Маска за відключення Starlink

В Україні продовжується процес верифікації комплектів супутникового інтернету Starlink. За словами міністра оборони Михайла Федорова,…

04.02.2026

Розробники програм для Apple тепер можуть використовувати в Xcode інструменти агентного кодування від OpenAI та Anthropic

Компанія Apple оголосила про випуск Xcode 26.3. Новий реліз популярного IDE дозволить розробникам використовувати агентні…

04.02.2026

Copilot всюди, але лише 3,3% користувачів Microsoft платять за нього

Лише 3,3% користувачів Microsoft 365 та Office 365, які працюють з Copilot Chat, платять за…

03.02.2026