Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4
Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.
Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».
Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.
Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.
Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.
Google оголосила про масштабне оновлення AI Studio. Замість браузерної платформи для експериментів з моделями Gemini…
Стартап Anysphere, відомий своїм агентним редактором коду Cursor, представив оновлену модель кодування під назвою Composer…
Компанія Anthropic анонсувала новий інструмент Claude Code Channels, який вже встигли назвати «вбивцею OpenClaw». Завдяки…
Google додає роз'яснення щодо свого майбутнього плану посилити контроль над екосистемою Android. Починаючи з березня…
Хакерське угруповання APT28 (також відоме як Fancy Bear або Strontium), яке пов’язують із російським ГРУ,…
OpenAI планує об'єднати свій додаток ChatGPT, платформу кодування Codex та браузер в одну «суперпрограму» для…