Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI
Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.
Метою багатьох IT-гігантів, включно з OpenAI, є навчання моделей кодування ШІ, здатних виконувати складні завдання розробки програмного забезпечення. Компанія стверджує, що її майбутні моделі зможуть програмувати цілі додатки, виконуючи такі завдання, як забезпечення якості, тестування помилок і написання документації.
«Ми оптимізували GPT-4.1, щоб покращити ті сфери, які найбільше цікавлять розробників: інтерфейсне кодування, зменшення кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, узгоджене використання інструментів тощо», — повідомив представник OpenAI.
Компанія-розробник стверджує, що повна модель GPT-4.1 перевершує поточну флагманську модель GPT-4o та GPT-4o mini за тестами кодування, включаючи SWE-bench. Що ж до GPT-4.1 nano, то її визнано найшвидшою і найдешевшою LLM-моделлю в історії.
GPT-4.1 коштує $2 за мільйон вхідних токенів і $8 за мільйон вихідних токенів. Робота з GPT-4.1 mini коштуватиме $0,40/мільйон вхідних токенів і $1,60/мільйон вихідних токенів. GPT-4.1 nano — $0,10/мільйон вхідних токенів і $0,40/мільйон вихідних токенів.
GPT-4.1 окремо перевірено за допомогою тесту Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досягла рекордної точності в 72% у категорії «довге відео без субтитрів», запевняють в OpenAI.
Черговий російський обстріл Харкова, який стався 22 жовтня, призвів до пошкодження будівлі Європейського інноваційного хабу,…
Після того, як кілька тижнів тому Microsoft оголосила про значне підвищення цін на свої консолі…
Після початку повномасштабного вторгнення українські ІТ-компанії стали природними партнерами армії. Для цього у них є…
Соцмережа X розширює закрите бета-тестування плану оплати за доступ до API для більшої кількості розробників.…
Хмарна платформа розробки, тестування та розгортання Google AI Studio отримала оновлення інтерфейсу та функцій, які…
OpenAI офіційно представила новий браузер під назвою ChatGPT Atlas. Він вже доступний для платформи macOS,…