Рубріки: Новини

Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4

Дмитро Сімагін

Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.

Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».

Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.

Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.

Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.

Останні статті

Ветерани з IT-досвідом зможуть отримати до $20 000 на розвиток бізнесу — SKELAR відкрив набір на акселераційну програму

Український венчур-білдер SKELAR відкрив набір на другий потік акселераційної програми Veteran Venture Program. Це безкоштовна…

04.05.2026

Індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI

На фоні фінальної підготовки до виходу GTA VI в мережі з'явився відгук анонімного співробітника Rockstar…

04.05.2026

Пентагон захопився вайб-кодингом: понад 100 000 ШІ-агентів за п’ять тижнів

Американські військові та цивільні співробітники Міністерства оборони США стрімко освоюють нову технологію штучного інтелекту —…

04.05.2026

Ажіотаж навколо OpenClaw не минув дарма: Apple «вбила» найдоступніший Mac mini

Apple тихо зняла з продажу базову конфігурацію Mac mini з 256 ГБ пам'яті за $599.…

04.05.2026

Пастка емпатії: дружня розмова з чат-ботом знижує ефективність відповідей

Нове дослідження, опубліковане в журналі Nature, виявило неочікуваний побічний ефект «дружніх» діалогів зі штучним інтелектом.…

04.05.2026

xAI запускає Custom Voices — миттєве клонування голосу для Grok

Компанія xAI представила функцію Custom Voices, яка дозволяє користувачам створювати ідентичну цифрову копію свого голосу.…

04.05.2026