Китайський стартап Z.ai, також відомий як Zhipu AI, представив свою найновішу розробку — модель штучного інтелекту GLM-5.1. Головна сенсація: це не просто чергова LLM, а повноцінний автономний агент з відкритим кодом, здатний виконувати завдання протягом усього робочого дня, пише Venture Beat.
Основний акцент у розробці зроблено на концепції “8-hour work day”. Якщо звичайні LLM відповідають на конкретний запит, то GLM-5.1 спроєктована для тривалих ітераційних процесів:
Модель GLM-5.1 має 754 мільярди параметрів та контекстне вікно до 202 752 токенів. У той час як інші сучасні моделі, таких як Claude Opus 4.6, досягли верхньої межі продуктивності в 3547 запитів за секунду, GLM-5.1 виконує 655 ітерацій та понад 6000 викликів інструментів на секунду.
Для тих, хто використовує API, Z.ai встановив ціну на GLM-5.1 в розмірі $1,40 за 1 мільйон вхідних токенів та $4,40 за 1 мільйон вихідних токенів. Також доступна знижка на кеш у розмірі $0,26 за мільйон вхідних токенів.
У бенчмарку SWE-Bench Pro, який оцінює здатність моделі вирішувати реальні проблеми GitHub за допомогою запиту інструкцій та контекстного вікна з 200 000 токенів, GLM-5.1 досяг балу 58,4. Щодо контексту, це перевершує GPT-5.4 з 57,7, Claude Opus 4.6 з 57,3 та Gemini 3.1 Pro з 54,2 .
Інші показники GLM-5.1 у порівнянні з конкурентами:
| Категорія | Claude 4 Opus | GLM-5.1 | GPT-5.4 |
| Кодинг (HumanEval) | 84.1% | 88.4% | 87.9% |
| Математика (GSM8K) | 94.2% | 96.5% | 95.8% |
| Довгий контекст (Recall) | 98.1% | 99.9% | 99.2% |
Реліз GLM-5.1 підтверджує тренд на «агентизацію» ШІ. Ми переходимо від ери «запитай-отримай відповідь» до ери «постав задачу — отримай готовий проєкт увечері». Для розробників це означає доступ до інструменту рівня Opus 4 без прив’язки до хмарних сервісів та дорогих підписок.
Нагадаємо, що програмісти — перші в зоні ризику: в Anthropic вже порахували, як швидко вас замінить LLM.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Відеосервіс YouTube розпочав тестування нової інтелектуальної функції, яка дозволяє автоматично змінювати швидкість відтворення ролика. Проте…
Представники бізнесу, державного сектору та наукової спільноти Японії й України обговорили український досвід створення стійкої…
Ілон Маск продовжує перетворювати X на «застосунок для всього». Сьогодні платформа розпочала масштабне розгортання двох…
Український бізнес уже давно перестав бути «локальним». Його не зупиняє навіть повномасштабна війна. Попри сирени, блекаути та…
Верховна Рада України сьогодні підтримала законопроєкт №15111-д про оподаткування цифрових платформ. Оскільки закон ухвалено в…
У додатку YouTube для смарт-телевізорів почали демонструвати рекламні ролики тривалістю 90 секунд, які неможливо пропустити.…