Рубріки: Новини

В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini

Дмитро Сімагін

OpenAI запускає Flex processing — нову опцію API, завдяки якій можна суттєво зекономити на використання моделей штучного інтелекту в обмін на повільний час відгуку та «тимчасову недоступність ресурсів». Про це повідомляє TechCrunch.

Як пояснюють на сайті OpenAI, Flex processing доступна в бета-версії для нещодавно випущених моделей міркувань o3 і o4-mini. Опція спрямована на виконання завдань з нижчим пріоритетом і «невиробничих» завдань, таких як оцінювання моделей, збагачення даних і асинхронні робочі навантаження.

Використання Flex processing зменшує витрати на API рівно вдвічі. Для o3 застосування Flex processing дає остаточну вартість роботи з моделлю на рівні $5/млн вхідних токенів (~750 000 слів) і $20/млн вихідних токенів. Стандартні ціні на використання o3 через API становлять $10/млн вхідних токенів і $40/млн вихідних токенів. Для o4-mini Flex знижує ціну до $0,55/млн вхідних токенів і $2,20/млн вихідних токенів, тоді як стандартна ціна становить $1,10/млн вхідних токенів і $4,40/млн вихідних токенів.

Запуск Flex processing стався в той час, коли конкуренти OpenAI випускають дешевші та ефективніші бюджетні моделі. Буквально вчора, 17 квітня, Google випустила Gemini 2.5 Flash — модель міркування, яка відповідає або перевершує рівню DeepSeek-R1 з точки зору продуктивності за нижчої вартості вхідних токенів.

В електронному листі для клієнтів OpenAI зазначає, що розробники, які хочуть використовувати модель o3 через API, повинні будуть пройти нещодавно введений процес ідентифікації. За словами представників OpenAI, така перевірка призначена для того, щоб зловмисники не порушували політику використання.

Останні статті

Microsoft оприлюднила системні вимоги до ігрових ПК на Windows 11

Microsoft вперше опублікувала детальні системні вимоги до ігрових ПК під Windows 11, розділивши їх на…

15.12.2025

За три місяці в Україні вдвічі зросла кількість miltech-вакансій. Але без віддаленої роботи

За останній квартал в Україні вдвічі збільшилась кількість miltech-вакансій. Зараз на Djinni розміщено 360 вакансій…

15.12.2025

В Android 17 з’явиться функція блокування окремих програм

Google готується додати в Android 17 нову функцію блокування окремих застосунків, ймовірно, за допомогою пароля…

15.12.2025

Українська освіта не встигає реагувати на дефіцит інженерів у DefenceTech — дослідження ITExpert

Навіть приріст у +82% заяв на окремі технічні спеціальності не покриває потреби ринку. На окремі…

15.12.2025

У Чернівцях судять студента-програміста КПІ, який зламав Netflix з метою продажу чужих акаунтів

Шевченківський районний суд міста Чернівці почав розгляд справи студента 2-го курсу факультету інформатики та обчислювальної…

15.12.2025

«Великий стрибок у програмуванні»: експерти поділились враженнями від GPT-5.2

Реакція експертів на нову LLM-модель GPT-5.2 від OpenAI, малює двояку картину: реліз названо великим кроком…

15.12.2025