Рубріки: Новини

Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4

Дмитро Сімагін

Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.

Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».

Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.

Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.

Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.

Останні статті

Популярний редактор коду Notepad++ зламано

Команда Notepad++ оголосила, що її інфраструктуру оновлень було скомпрометовано китайським хакером у період між червнем…

02.02.2026

Україна може допомогти Європі зменшити технологічну залежність від США та Китаю — дослідження

Україна здатна допомогти Європейському Союзу зменшити частину його технологічних залежностей від США та Китаю. Про…

02.02.2026

Anthropic додала агентні плагіни в інструмент автоматизації Cowork

Компанія Anthropic інтегрувала в Cowork агентні плагіни, які дозволяють налаштовувати модель Claude під конкретні корпоративні…

02.02.2026

Реліз генератора ігрових світів Project Genie від Google обвалив акції геймдев-компаній

Акції найбільших геймдев-компаній обвалились після того, як Google представила нову модель Genie 3 та генератор…

02.02.2026

«Я створив функцію за два тижні, на яку раніше треба було витратити рік»: розробники Bluesky стверджують, що з традиційним кодуванням «все скінчено»

Опитування професійних розробників соцмережі Bluesky виявило, що більшість з них вважають інструменти штучного інтелекту логічним…

02.02.2026

У Хмельницькому суд зобов’язав програміста задонатити 100 000 грн на підтримку ЗСУ

Хмельницький міськрайонний суд ухвалив рішення у справі провідного програміста ТОВ «Екзедепт», який намагався за допомогою…

02.02.2026