Рубріки: Новини

В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini

Дмитро Сімагін

OpenAI запускає Flex processing — нову опцію API, завдяки якій можна суттєво зекономити на використання моделей штучного інтелекту в обмін на повільний час відгуку та «тимчасову недоступність ресурсів». Про це повідомляє TechCrunch.

Як пояснюють на сайті OpenAI, Flex processing доступна в бета-версії для нещодавно випущених моделей міркувань o3 і o4-mini. Опція спрямована на виконання завдань з нижчим пріоритетом і «невиробничих» завдань, таких як оцінювання моделей, збагачення даних і асинхронні робочі навантаження.

Використання Flex processing зменшує витрати на API рівно вдвічі. Для o3 застосування Flex processing дає остаточну вартість роботи з моделлю на рівні $5/млн вхідних токенів (~750 000 слів) і $20/млн вихідних токенів. Стандартні ціні на використання o3 через API становлять $10/млн вхідних токенів і $40/млн вихідних токенів. Для o4-mini Flex знижує ціну до $0,55/млн вхідних токенів і $2,20/млн вихідних токенів, тоді як стандартна ціна становить $1,10/млн вхідних токенів і $4,40/млн вихідних токенів.

Запуск Flex processing стався в той час, коли конкуренти OpenAI випускають дешевші та ефективніші бюджетні моделі. Буквально вчора, 17 квітня, Google випустила Gemini 2.5 Flash — модель міркування, яка відповідає або перевершує рівню DeepSeek-R1 з точки зору продуктивності за нижчої вартості вхідних токенів.

В електронному листі для клієнтів OpenAI зазначає, що розробники, які хочуть використовувати модель o3 через API, повинні будуть пройти нещодавно введений процес ідентифікації. За словами представників OpenAI, така перевірка призначена для того, щоб зловмисники не порушували політику використання.

Останні статті

Anthropic випускає бета-версію розширення Claude для Excel

Компанія Anthropic виходить на ринок інструментів для фінансових фахівців, випустивши розширення Claude для Excel, інтеграцію…

28.10.2025

Google: до кінця року всі зможуть створювати відеоігри за допомогою вайб-кодингу

Керівник напрямку Google AI Studio Логан Кілпатрік заявив, що вже до кінця 2025 року кожен…

28.10.2025

«Ви все не так зрозуміли»: Microsoft заперечує, що її штучний інтелект навчають на скріншотах Windows 11

Microsoft стверджує, що не використовує дані користувачів для навчання свого штучного інтелекту. Однак компанія не…

28.10.2025

Український стартап єВізитка представив нову версію цифрових візиток

Підприємці все ще використовують візитні картки, але частка паперових карток з року в рік падає,…

28.10.2025

Прибутки від шкідливого софту падають: жертви перестають платити хакерам

Кількість жертв, які платять хакерам, досягла нового мінімуму: лише 23% компаній, що зазнали зламу, погодилися…

28.10.2025

Стартапи в США переходять на 6-денний графік через конкуренцію з Китаєм

У Сан-Франциско знову стає популярною культура «grind» — позанормовий графік роботи заради успіху стартапу. Молоді…

27.10.2025