Рубріки: Новини

«Краще, ніж DeepSeek і OpenAI»: ​​Alibaba випустила модель з відкритим кодом, яка дешевше конкурентів

Дмитро Сімагін

Компанія Alibaba представила QwQ-32B — нову модель з відкритим кодом з сімейства великих мовних моделей Qwen. Як стверджують її розробники, вона перевершує продуктивність конкурентів: DeepSeek-R1 і o1-mini, незважаючи на  свої відносно скромні 32 мільярди параметрів. Про це пише Venture Beat.

Команда, яка працювала над створенням QwQ-32B, запевняє, що менша кількість параметрів дозволяє моделі працювати з меншими вимогами до обчислювальних ресурсів, що сприяє більш широкому застосуванню.

Наприклад, у той час як DeepSeek-R1 має 671 мільярд параметрів, QwQ-32B досягає схожої продуктивності з набагато меншими ресурсами. Вона вимагає лише 24 ГБ відеопам’яті на графічному процесорі (Nvidia H100 має 80 ГБ) у порівнянні з понад 1500 ГБ відеопам’яті для повноцінної роботи DeepSeek R1 (16 відеокарт Nvidia A100). Це підкреслює ефективність використання QwQ-32B. 

Модель вже доступна на Hugging Face і ModelScope. Оскільки вона має ліцензію Apache 2.0, це означає, що QwQ-32B може безкоштовно використовуватись для будь-яких комерційних і дослідницьких цілей.

Першу модель сімейства QwQ (скорочення від Qwen-with-Questions), було представлено в листопаді 2024 року. Спочатку ранні ітерації QwQ не вразили експертів, оскільки моделі мали проблеми з тестами програмування, такими як LiveCodeBench, де розробки OpenAI зберігали перевагу. 

Останні статті

Гранти для Web3-продуктів: у Львові пройде безкоштовний хакатон ETHLviv Impulse

ETHLviv Impulse — безкоштовний одноденний хакатон із грантами для найсильніших команд — пройде 16 листопада…

04.11.2025

«Найбільший злом 2025 року»: хакер атакував криптопротокол Balancer DeFi і викрав понад $128 мільйонів

Децентралізований фінансовий (DeFi) протокол Balancer оголосив, що хакери атакували його пули v2, в результаті чого…

04.11.2025

«Демонструє постійну тенденцію брехати»: колишній соратник Сема Альтмана дав покази проти нього

Події дворічної давнини, коли в OpenAI стався заколот, який призвів до тимчасового відсторонення Сема Альтмана,…

04.11.2025

Apple повністю оновила веб-версію App Store

Компанія Apple радикально змінила веб-інтерфейс свого магазину додатків та цифрового контенту App Store. Тепер користувачі…

04.11.2025

Експерти прогнозують зниження попиту на розробників штучного інтелекту: агенти краще пишуть код

Згідно з галузевим опитуванням IEEE, попит на розробників програмного забезпечення для роботи штучного інтелекту наступного…

04.11.2025

«У нас є графічні процесори, але їх не можна підключити»: CEO Microsoft скаржиться на нестачу електроенергії

Генеральний директор Microsoft Сатья Наделла заявив, що проблема індустрії штучного інтелекту полягає в нестачі енергетичних…

03.11.2025