Рубріки: Новини

GLM-5.1: відкрита модель, яка випереджає Claude Opus 4.6 та працює «повний день»

Дмитро Сімагін

Китайський стартап Z.ai, також відомий як Zhipu AI, представив свою найновішу розробку — модель штучного інтелекту GLM-5.1. Головна сенсація: це не просто чергова LLM, а повноцінний автономний агент з відкритим кодом, здатний виконувати завдання протягом усього робочого дня, пише Venture Beat.

Що робить GLM-5.1 особливою?

Основний акцент у розробці зроблено на концепції “8-hour work day”. Якщо звичайні LLM відповідають на конкретний запит, то GLM-5.1 спроєктована для тривалих ітераційних процесів:

  • Агентивність (Agentic AI): Модель може самостійно планувати кроки, використовувати зовнішні інструменти (браузер, термінал, API) та виправляти власні помилки без підказок користувача.
  • Перемога над закритими моделями: Згідно з бенчмарками, GLM-5.1 обходить Claude 4.6 Opus у завданнях на логіку, програмування та складне міркування.
  • Відкритість: На відміну від пропрієтарних моделей від OpenAI чи Anthropic, GLM-5.1 поширюється з відкритими вагами (open-source), що дає розробникам можливість розгортати її на власних потужностях.

Модель GLM-5.1 має 754 мільярди параметрів та контекстне вікно до 202 752 токенів. У той час як інші сучасні моделі, таких як Claude Opus 4.6, досягли верхньої межі продуктивності в 3547 запитів за секунду, GLM-5.1 виконує 655 ітерацій та понад 6000 викликів інструментів на секунду.

Для тих, хто використовує API, Z.ai встановив ціну на GLM-5.1 в розмірі $1,40 за 1 мільйон вхідних токенів та $4,40 за 1 мільйон вихідних токенів. Також доступна знижка на кеш у розмірі $0,26 за мільйон вхідних токенів.

У бенчмарку SWE-Bench Pro, який оцінює здатність моделі вирішувати реальні проблеми GitHub за допомогою запиту інструкцій та контекстного вікна з 200 000 токенів, GLM-5.1 досяг балу 58,4. Щодо контексту, це перевершує GPT-5.4 з 57,7, Claude Opus 4.6 з 57,3 та Gemini 3.1 Pro з 54,2 .

Інші показники GLM-5.1 у порівнянні з конкурентами:

Категорія Claude 4 Opus GLM-5.1 GPT-5.4
Кодинг (HumanEval) 84.1% 88.4% 87.9%
Математика (GSM8K) 94.2% 96.5% 95.8%
Довгий контекст (Recall) 98.1% 99.9% 99.2%

Реліз GLM-5.1 підтверджує тренд на «агентизацію» ШІ. Ми переходимо від ери «запитай-отримай відповідь» до ери «постав задачу — отримай готовий проєкт увечері». Для розробників це означає доступ до інструменту рівня Opus 4 без прив’язки до хмарних сервісів та дорогих підписок.

Нагадаємо, що програмісти — перші в зоні ризику: в Anthropic вже порахували, як швидко вас замінить LLM.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Останні статті

Штучний інтелект в YouTube тепер сам обирає ідеальну швидкість для відео

Відеосервіс YouTube розпочав тестування нової інтелектуальної функції, яка дозволяє автоматично змінювати швидкість відтворення ролика. Проте…

08.04.2026

Український досвід цифровізації представили в Токіо: у фокусі — ШІ, GovTech і кіберстійкість

Представники бізнесу, державного сектору та наукової спільноти Японії й України обговорили український досвід створення стійкої…

08.04.2026

X запускає автоматичний переклад та редагування фото на базі Grok

Ілон Маск продовжує перетворювати X на «застосунок для всього». Сьогодні платформа розпочала масштабне розгортання двох…

08.04.2026

Як український бізнес стає глобальним: в MC.today, The Page, ITC, SPEKA та Highload стартує спецпроєкт «Визнані у світі»

Український бізнес уже давно перестав бути «локальним». Його не зупиняє навіть повномасштабна війна. Попри сирени, блекаути та…

08.04.2026

Рада ухвалила Закон про оподаткування доходів з цифрових платформ: що це означає для українців

Верховна Рада України сьогодні підтримала законопроєкт №15111-д про оподаткування цифрових платформ. Оскільки закон ухвалено в…

08.04.2026

YouTube закручує гайки: з’явилась 90-секундна реклама, яку неможливо пропустити

У додатку YouTube для смарт-телевізорів почали демонструвати рекламні ролики тривалістю 90 секунд, які неможливо пропустити.…

08.04.2026