Рубріки: Новини

«Краще, ніж DeepSeek і OpenAI»: ​​Alibaba випустила модель з відкритим кодом, яка дешевше конкурентів

Дмитро Сімагін

Компанія Alibaba представила QwQ-32B — нову модель з відкритим кодом з сімейства великих мовних моделей Qwen. Як стверджують її розробники, вона перевершує продуктивність конкурентів: DeepSeek-R1 і o1-mini, незважаючи на  свої відносно скромні 32 мільярди параметрів. Про це пише Venture Beat.

Команда, яка працювала над створенням QwQ-32B, запевняє, що менша кількість параметрів дозволяє моделі працювати з меншими вимогами до обчислювальних ресурсів, що сприяє більш широкому застосуванню.

Наприклад, у той час як DeepSeek-R1 має 671 мільярд параметрів, QwQ-32B досягає схожої продуктивності з набагато меншими ресурсами. Вона вимагає лише 24 ГБ відеопам’яті на графічному процесорі (Nvidia H100 має 80 ГБ) у порівнянні з понад 1500 ГБ відеопам’яті для повноцінної роботи DeepSeek R1 (16 відеокарт Nvidia A100). Це підкреслює ефективність використання QwQ-32B. 

Модель вже доступна на Hugging Face і ModelScope. Оскільки вона має ліцензію Apache 2.0, це означає, що QwQ-32B може безкоштовно використовуватись для будь-яких комерційних і дослідницьких цілей.

Першу модель сімейства QwQ (скорочення від Qwen-with-Questions), було представлено в листопаді 2024 року. Спочатку ранні ітерації QwQ не вразили експертів, оскільки моделі мали проблеми з тестами програмування, такими як LiveCodeBench, де розробки OpenAI зберігали перевагу. 

Останні статті

Аналіз трафіку чат-ботів: чому користувачі йдуть від ChatGPT?

Ринок споживчих ШІ-сервісів демонструє стрімку трансформацію. Згідно з останніми статистичними даними Similarweb, за останній рік…

14.05.2026

«Дія» тепер має ШІ-агента в смартфоні: штрафи, довідки та держпослуги через чат

Мінцифри масштабує використання штучного інтелекту в екосистемі державних послуг. Відтепер персональний асистент Дія.AI доступний безпосередньо…

14.05.2026

Claude змінить тарифікацію з 15 червня: окремий бюджет для SDK і сторонніх застосунків

З 15 червня 2026 року Anthropic розділить програмне використання Claude і звичайні підписні ліміти. Замість…

14.05.2026

Meta запускає Instants — миттєвий обмін фотографіями в Instagram

Meta представила Instants — інструмент для спонтанного та невідфільтрованого обміну фотографіями з друзями. Продукт вийшов…

14.05.2026

Новий тренд: у кожній восьмій IT-вакансії в Україні згадується штучний інтелект

Кожна восьма IT-вакансія, розміщена в українському сервісі пошуку роботи Djinni, сьогодні згадує AI або LLM…

14.05.2026

Claude Code допоміг повернути Bitcoin-гаманець, заблокований 12 років тому

Користувач під ніком cprkrn поділився у соцмережі X неймовірною історією: ШІ-інструмент Claude Code допоміг йому…

14.05.2026