Рубріки: Новини

Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4

Дмитро Сімагін

Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.

Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».

Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.

Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.

Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.

Останні статті

Вайб-кодування переходить на новий рівень: Google AI Studio стає повноцінним браузерним IDE

Google оголосила про масштабне оновлення AI Studio. Замість браузерної платформи для експериментів з моделями Gemini…

20.03.2026

Composer 2: в Cursor додали модель, яка випереджає Claude Opus 4.6

Стартап Anysphere, відомий своїм агентним редактором коду Cursor, представив оновлену модель кодування під назвою Composer…

20.03.2026

Anthropic запускає «вбивцю OpenClaw» — Claude Code Channels

Компанія Anthropic анонсувала новий інструмент Claude Code Channels, який вже встигли назвати «вбивцею OpenClaw». Завдяки…

20.03.2026

Google залишить можливість встановлювати неперевірені Android-додатки. Але з «режимом очікування»

Google додає роз'яснення щодо свого майбутнього плану посилити контроль над екосистемою Android. Починаючи з березня…

20.03.2026

Хакери використовують критичну вразливість Zimbra для атак на українські державні установи

Хакерське угруповання APT28 (також відоме як Fancy Bear або Strontium), яке пов’язують із російським ГРУ,…

20.03.2026

ChatGPT, браузер та Codex об’єднають в єдину суперпрограму для ПК

OpenAI планує об'єднати свій додаток ChatGPT, платформу кодування Codex та браузер в одну «суперпрограму» для…

20.03.2026