Рубріки: Новини

Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI

Дмитро Сімагін

Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.

Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.

«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.

Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.

GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.

GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.

Останні статті

Через російський обстріл постраждав Харківський ІТ кластер

Черговий російський обстріл Харкова, який стався 22 жовтня, призвів до пошкодження будівлі Європейського інноваційного хабу,…

22.10.2025

Microsoft значно підвищує ціни на комплекти розробника Xbox

Після того, як кілька тижнів тому Microsoft оголосила про значне підвищення цін на свої консолі…

22.10.2025

Безпілотники, AI та антидроновий захист: Топ розробок IT-компанії Favbet Tech для оборони країни

Після початку повномасштабного вторгнення українські ІТ-компанії стали природними партнерами армії. Для цього у них є…

22.10.2025

X тестує модель «оплати за використання» для свого API

Соцмережа X розширює закрите бета-тестування плану оплати за доступ до API для більшої кількості розробників.…

22.10.2025

Google розширює можливості вайб-кодингу на платформі AI Studio

Хмарна платформа розробки, тестування та розгортання Google AI Studio отримала оновлення інтерфейсу та функцій, які…

22.10.2025

OpenAI представила браузер ChatGPT Atlas — альтернативу Google Chrome з пам’яттю та агентами

OpenAI офіційно представила новий браузер під назвою ChatGPT Atlas. Він вже доступний для платформи macOS,…

22.10.2025