Рубріки: Новини

Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI

Дмитро Сімагін

Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.

Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.

«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.

Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini  за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.

GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.

GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.

Останні статті

«Вже кілька місяців ніхто не пише код руками»: співробітник Anthropic розповів про робочі процеси

Користувач Reddit під псевдонімом oh1n опублікував вірусний пост, в якому розповів про свого друга —…

30.03.2026

Нуль шансів для хакерів: Apple заявляє про абсолютну стійкість Lockdown Mode

Компанія Apple заявила про надзвичайну ефективність свого захисного механізму Lockdown Mode. Згідно з офіційним звітом,…

30.03.2026

Ethereum за 12 секунд: Віталік Бутерін готує відповідь для Solana

Засновник Ethereum Віталік Бутерін представив нову пропозицію, яка здатна кардинально змінити механізм транзакцій ETH. Йдеться…

30.03.2026

Навчіться створювати ШІ-агентів: Google запускає безкоштовний онлайн-курс для українців

Компанія Google Cloud за інформаційної підтримки Міністерства цифрової трансформації України відкриває реєстрацію на нову навчальну…

30.03.2026

Вчені б’ють тривогу: люди небезпечно прив’язуються до штучного інтелекту, який «ніколи не каже ні»

Сучасні великі мовні моделі (LLM) мають серйозну ваду, яку вчені називають «сикофантством». Замість того, щоб…

30.03.2026

Спочатку Western Digital, тепер Sony: глобальний дефіцит пам’яті поглиблюється

Технологічний гігант Sony офіційно оголосив про тимчасове припинення замовлень на більшість своїх лінійок карт пам'яті…

30.03.2026