Рубріки: Новини

Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI

Дмитро Сімагін

Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.

Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.

«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.

Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.

GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.

GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.

Останні статті

Ваш ноутбук працює, поки ви в кафе: Codex тепер можна керувати з мобільного додатку ChatGPT

Компанія OpenAI оголосила про новий спосіб взаємодії із системою агентного програмування Codex — безпосередньо зі…

15.05.2026

Аналіз трафіку чат-ботів: чому користувачі йдуть від ChatGPT?

Ринок споживчих ШІ-сервісів демонструє стрімку трансформацію. Згідно з останніми статистичними даними Similarweb, за останній рік…

14.05.2026

«Дія» тепер має ШІ-агента в смартфоні: штрафи, довідки та держпослуги через чат

Мінцифри масштабує використання штучного інтелекту в екосистемі державних послуг. Відтепер персональний асистент Дія.AI доступний безпосередньо…

14.05.2026

Claude змінить тарифікацію з 15 червня: окремий бюджет для SDK і сторонніх застосунків

З 15 червня 2026 року Anthropic розділить програмне використання Claude і звичайні підписні ліміти. Замість…

14.05.2026

Meta запускає Instants — миттєвий обмін фотографіями в Instagram

Meta представила Instants — інструмент для спонтанного та невідфільтрованого обміну фотографіями з друзями. Продукт вийшов…

14.05.2026

Новий тренд: у кожній восьмій IT-вакансії в Україні згадується штучний інтелект

Кожна восьма IT-вакансія, розміщена в українському сервісі пошуку роботи Djinni, сьогодні згадує AI або LLM…

14.05.2026