Рубріки: Новини

OpenAI випускає безкоштовну модель o3-mini, яка краща в кодуванні, ніж флагманська o1

Дмитро Сімагін

OpenAI намагається перехопити ініціативу у китайської компанії DeepSeek випуском нової моделі міркування o3-mini. На відміну від інших сучасних моделей OpenAI, вона є безкоштовною для всіх користувачів сервісу, повідомляє ArsTechnica. 

Як запевняють в блозі OpenAI, o3-mini «розширює межі можливостей маленьких моделей». Вона оптимізована для функцій STEM і демонструє «особливу силу в науці, математиці та кодуванні». Користувачі платних пакетів Plus і Team отримають підвищений ліміт використання: 150 повідомлень щодня, для безкоштовних користувачів кількість обмежена 100 запитами на день.

Під час використання o3-mini можна обрати три різні «варіанти міркування». Це дозволяє точно налаштувати баланс між затримкою та точністю залежно від завдання. Найнижчий з цих рівнів міркування в математичних тестах і тестах кодування можна порівняти з попередньою моделлю o1-mini. Однак найвищий рівень o3-mini відповідає або перевершує повноцінну модель o1 у тих же тестах.

Представники OpenAI стверджують, що тестувальники моделі повідомили про 39-відсоткове зменшення «значних помилок» при використанні o3-mini порівняно з o1-mini, і віддали перевагу відповідям o3-mini у 56% випадків. Середня версія o3-mini пропонує в середньому на 24% швидший час відгуку, ніж o1-mini — з 10,16 секунди до 7,7 секунди.

У тестах кодування o3-mini є найефективнішою моделлю, перевіреною SWEbench. Нова модель перевершує o1-high навіть при середніх зусиллях міркування, підкреслюючи свою ефективність у завданнях генерації коду. 

Останні статті

Більше 8 млрд грн податків. Стільки сплатили резиденти Дія.City в І кварталі 2025 року

Резиденти Дія.City сплатили до бюджету понад 8 млрд грн податків в І кварталі 2025 року.…

18.04.2025

Китайських офісних працівників закликають менше працювати. Це має допомогти місцевій економіці

У Китаї закликають офісних працівників не працювати надто багато — держава сподівається, що вільний час…

18.04.2025

ChatGPT значно покращив пошук місць по фото. Це посилює проблеми конфіденційності

Експерти звертають увагу на тривожну тенденцію: люди все частіше використовують ChatGPT, щоб визначити місцезнаходження, зображене…

18.04.2025

Середовище розробки IntelliJ IDEA оновлено до версії 2025.1

Компанія JetBrains випустила нову версію мультимовного середовища розробки IntelliJ IDEA 2025.1. Оновлена IDE отримала численні…

18.04.2025

Discord впроваджує функцію сканування обличчя для перевірки віку користувачів

Платформа обміну миттєвими повідомленнями Discord впроваджує функцію перевірки віку за допомогою сканування обличчя. Зараз вона…

18.04.2025

Wikipedia випустила спеціальний датасет, щоб відволікти увагу ботів

Wikipedia намагається захистити себе від тисяч різноманітних ботів-скрейперів, які сканують дані цієї платформи для навчання…

18.04.2025