Рубріки: Новини

Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI

Дмитро Сімагін

Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.

Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.

«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.

Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.

GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.

GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.

Останні статті

Міноборони розширило функціонал мобільного додатку Резерв+

Міністерство оборони України розширило можливість сплати штрафів через мобільний додаток Резерв+. Тепер у ньому можна…

05.09.2025

Побутова техніка Tesla: армовані метали, передові полімери та доступна ціна. Що представлено в лінійках

Втома від техніки, яка швидко зношується, змушує українців переглядати підхід до покупок. Відтепер на перше…

05.09.2025

Код, згенерований інструментами ШІ, створює вдесятеро більше проблем безпеки

Спеціалісти компанії Apiiro, які проаналізували код з десятків тисяч репозиторіїв, виявили, що розробники за допомогою…

05.09.2025

Державна платформа Brave1 оголошує гранти до 100 млн грн для ШІ-розробників

Маркетплейс Brave1 — онлайн-платформа, що об'єднує українських військових та розробників — запускає грантовий конкурс з…

05.09.2025

У Києві пройде перший хакатон з вайб-кодингу: як взяти участь

4-5 жовтня в Києві на Подолі пройде захід Vibecoding Hackathon. Протягом двох днів розробники, користувачі…

05.09.2025

OpenAI запустить платформу для IT-найму та програму сертифікації навичок

OpenAI готується запустити платформу для найму, яка конкуруватиме з LinkedIn. Майбутній сервіс під назвою OpenAI…

05.09.2025