Рубріки: Новини

Новий безкоштовний агент Tongyi DeepResearch від Alibaba перевершив OpenAI o3 і Claude Sonnet 4

Дмитро Сімагін

Дослідницька команда Tongyi Lab, яка входить в структуру Alibaba, представила нову агентну LLM-модель Tongyi DeepResearch. Вона має відкритий код і призначена для проведення «глибоких досліджень» в інтернеті та складання точних звітів для окремих осіб та організацій. Про це повідомляє Venture Beat.

Як запевняють у Tongyi Lab, це «перший повністю відкритий веб-агент, який досягає продуктивності, нарівні з Deep Research від OpenAI, маючи лише 30 мільярдів параметрів (з них активовано 3 мільярди)».

Бенчмарки, опубліковані Tongyi Lab, демонструють, що Tongyi DeepResearch Agent працює на рівні або перевершує більшість альтернатив. Наприклад, він досяг показника 32.9 на Останньому іспиті людства (HLE) — це найвище досягнення серед усіх протестованих моделей, навіть перевершує o3 від OpenAI.

Ці результати ставлять Tongyi DeepResearch вище за інші моделі з відкритим кодом, такі як DeepSeek V3.1, Kimi K2 та Claude Sonnet 4, за кількістю завдань, незважаючи на його відносно скромний розмір.

Як і LLM Qwen3-30B-A3B, від якої він походить, агент Tongyi DeepResearch доступний безкоштовно для розробників та організацій для завантаження, налаштування та розгортання — навіть для комерційних програм, продуктів та робочих процесів — через платформи HuggingFace, GitHub та ModelScope — за ліцензією Apache 2.0.

Останні статті

«У нас є графічні процесори, але їх не можна підключити»: CEO Microsoft скаржиться на нестачу електроенергії

Генеральний директор Microsoft Сатья Наделла заявив, що проблема індустрії штучного інтелекту полягає в нестачі енергетичних…

03.11.2025

Alibaba відкрила безкоштовний доступ до своєї найпотужнішої моделі Qwen3-Max Thinking

Компанія Alibaba представила нову флагманську LLM-модель Qwen3 Max Thinking. Вона має режим міркування і вже…

03.11.2025

Y Combinator змінить свої правила заради українських фаундерів, які не можуть виїхати з країни

Найвідоміший у світі стартап-акселератор Y Combinator оголосив набір в зимову програму, яка триватиме з січня…

03.11.2025

Ілон Маск анонсував запуск месенджера X Chat, система шифрування якого «схожа на біткойн»

Компанія X готує до запуску окрему програму для обміну повідомленнями під назвою X Chat. Вона…

03.11.2025

В OpenAI з’явилась нова категорія фахівців — Super Junior

Компанія OpenAI все частіше бере до себе на роботу фахівців рівня Super Junior — початківців,…

03.11.2025

Найкращий квартал року: експорт ІТ-послуг з України демонструє зростання

За підсумками вересня 2025 року обсяг IT-експорту з України становив $557 мільйонів, що на $17…

31.10.2025