Рубріки: Новини

Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI

Дмитро Сімагін

Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.

Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.

«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.

Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.

GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.

GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.

Останні статті

Amazon викрила IT-фахівця з КНДР завдяки мілісекундам затримки при натисканні клавіатури

Північнокорейського самозванця, який віддалено працював системним адміністратором в американському Amazon, викрили після того, як затримка…

19.12.2025

В українському IT на третину поменшало початківців

Вітчизняна IT-галузь демонструє ознаки повільного зростання після суттєвого падіння показників у 2022-23 роках. Наприкінці 2025…

19.12.2025

Після обурення спільноти GitHub відмовляється від плану стягувати плату за self-hosted раннери

Не минуло й двох діб після того, як GitHub оголосив про запровадження з 1 березня…

19.12.2025

JetBrains випустила Kotlin 2.3.0. Реліз має експериментальні функції та підтримку Java 25

JetBrains випустила загальнодоступне останнє оновлення мови програмування Kotlin 2.3.0. Новий реліз має низку експериментальних функцій,…

19.12.2025

Нову модель GPT-5.2-Codex від OpenAI названо «найдосконалішим інструментом для реальної розробки»

Компанія OpenAI офіційно представила GPT-5.2-Codex — нову модель, яку названо «найдосконалішим інструментом для реальної розробки…

19.12.2025

Мінфін все ж таки готується ввести ПДВ для ФОП третьої групи

Міністерство фінансів України опублікувало законопроект про введення ПДВ для ФОП 1-3 груп. Прогнозується, що нові…

18.12.2025