Рубріки: Новини

OpenAI випускає безкоштовну модель o3-mini, яка краща в кодуванні, ніж флагманська o1

Дмитро Сімагін

OpenAI намагається перехопити ініціативу у китайської компанії DeepSeek випуском нової моделі міркування o3-mini. На відміну від інших сучасних моделей OpenAI, вона є безкоштовною для всіх користувачів сервісу, повідомляє ArsTechnica. 

Як запевняють в блозі OpenAI, o3-mini «розширює межі можливостей маленьких моделей». Вона оптимізована для функцій STEM і демонструє «особливу силу в науці, математиці та кодуванні». Користувачі платних пакетів Plus і Team отримають підвищений ліміт використання: 150 повідомлень щодня, для безкоштовних користувачів кількість обмежена 100 запитами на день.

Під час використання o3-mini можна обрати три різні «варіанти міркування». Це дозволяє точно налаштувати баланс між затримкою та точністю залежно від завдання. Найнижчий з цих рівнів міркування в математичних тестах і тестах кодування можна порівняти з попередньою моделлю o1-mini. Однак найвищий рівень o3-mini відповідає або перевершує повноцінну модель o1 у тих же тестах.

Представники OpenAI стверджують, що тестувальники моделі повідомили про 39-відсоткове зменшення «значних помилок» при використанні o3-mini порівняно з o1-mini, і віддали перевагу відповідям o3-mini у 56% випадків. Середня версія o3-mini пропонує в середньому на 24% швидший час відгуку, ніж o1-mini — з 10,16 секунди до 7,7 секунди.

У тестах кодування o3-mini є найефективнішою моделлю, перевіреною SWEbench. Нова модель перевершує o1-high навіть при середніх зусиллях міркування, підкреслюючи свою ефективність у завданнях генерації коду. 

Останні статті

App Store запроваджує додаткові вікові обмеження для програм: 13+, 16+ і 18+

Маркетплейс мобільних застосунків App Store оновив віковий рейтинг для програм. Додано нові рейтингові обмеження та…

25.07.2025

Американку посадили на 8,5 років за «ферму ноутбуків» для північнокорейських програмістів

Жительку Аризони, яка облаштувала у себе вдома ферму з 90 ноутбуків, допомагаючи північнокорейським ІТ-спеціалістам видавати…

25.07.2025

В Android додали можливість запуску графічних програм Linux

На канал Android Canary, який прийшов на зміну Android Developer Preview і використовується для тестування…

25.07.2025

Інструмент кодування Figma Make став загальнодоступним

Figma Make, інструмент для створення коду на основі текстових запитів, який компанія Figma представила раніше…

25.07.2025

Стався масштабний збій Starlink. Спостерігаються проблеми в роботі по всьому світу

Увечері 24 липня по всьому світу почали повідомляти про збій роботи Starlink. Проблеми в роботі…

24.07.2025

У Верховній раді зареєстровано законопроєкт про заборону російського ПЗ

У Раді зареєстрували законопроєкт, який забороняє використовувати та продавати в Україні ІТ-продукти, пов’язані з росією.…

24.07.2025