OpenAI випустила модель GPT‑5.2, яка перевершує людей у 70,9% завдань
OpenAI випустила нову LLM-модель GPT-5.2 у версіях Instant, Thinking та Pro, розгорнувши їх для платних планів, таких як Plus, Pro, Business та Enterprise. Новинка вже доступна для всіх розробників через API. Разом з цим Microsoft негайно додає GPT-5.2 до Microsoft 365 Copilot та Microsoft Copilot Studio, повідомляє блог компанії.
В OpenAI стверджують, що в бенчмарках модель GPT-5.2 Thinking перевершує або працює на рівні провідних фахівців галузі у 70,9% завдань інтелектуальної роботи (GDPval), виконуючи її більш ніж в 11 разів швидше. При цьому вартість роботи моделі коштує менше ніж 1% від вартості роботи людей-експертів.
«Версія 5.2 найкраще підходить для створення електронних таблиць, презентацій, написання коду, генерації зображень, розуміння довгого контексту, використання інструментів, а потім пов’язування складних, багатоетапних проектів», — заявив Фіджі Сімо, головний директор з продуктів OpenAI.
Три рівні моделей виконують різні функції: Instant обробляє швидкі завдання, такі як письмо та переклад; Thinking може впоратися з більш складною роботою, такою як кодування та математика; а Pro забезпечує найвищу точність для багатоетапних задач.
GPT-5.2 має контекстне вікно на 400 000 токенів, що дозволяє їй обробляти сотні документів одночасно. Ціна доступу до моделі через API становить $1,75 за мільйон вхідних токенів для стандартної моделі, що на 40% дорожче, ніж GPT-5.1.
У кодуванні GPT-5.2 Thinking набирає 55,6% у бенчмарку SWE-Bench Pro та 80% у SWE-Bench Verified, що вище, ніж у GPT-5.1-Codex-Max.
OpenAI запевняє, що попередня версія GPT-5.1 залишатиметься доступною в ChatGPT для платних користувачів протягом трьох місяців у випадаючому списку застарілих моделей.
Команда Google Labs представила експериментальний браузер Disco на базі Gemini 3. Він включає інструмент GenTabs,…
Український підприємець Віталій Саврига запустив AiDeliv — першу у світі AI-біржу для міжнародної логістики. Платформа…
Microsoft випустила публічний реліз редактора коду Visual Studio Code 1.107. У перелік оновлень цього випуску…
Після кількох місяців тестування норвезька компанія Opera Software нарешті зробила свій браузер Neon на базі…
Понад 10 000 образів контейнерів Docker Hub розкривають конфіденційні дані розробників, включаючи облікові дані для…
Українська сфера штучного інтелекту продовжує зростати. Як стверджується в дослідженні AI HOUSE, кількість вітчизняних ШІ-спеціалістів…