Рубріки: Новини

В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini

Дмитро Сімагін

OpenAI запускає Flex processing — нову опцію API, завдяки якій можна суттєво зекономити на використання моделей штучного інтелекту в обмін на повільний час відгуку та «тимчасову недоступність ресурсів». Про це повідомляє TechCrunch.

Як пояснюють на сайті OpenAI, Flex processing доступна в бета-версії для нещодавно випущених моделей міркувань o3 і o4-mini. Опція спрямована на виконання завдань з нижчим пріоритетом і «невиробничих» завдань, таких як оцінювання моделей, збагачення даних і асинхронні робочі навантаження.

Використання Flex processing зменшує витрати на API рівно вдвічі. Для o3 застосування Flex processing дає остаточну вартість роботи з моделлю на рівні $5/млн вхідних токенів (~750 000 слів) і $20/млн вихідних токенів. Стандартні ціні на використання o3 через API становлять $10/млн вхідних токенів і $40/млн вихідних токенів. Для o4-mini Flex знижує ціну до $0,55/млн вхідних токенів і $2,20/млн вихідних токенів, тоді як стандартна ціна становить $1,10/млн вхідних токенів і $4,40/млн вихідних токенів.

Запуск Flex processing стався в той час, коли конкуренти OpenAI випускають дешевші та ефективніші бюджетні моделі. Буквально вчора, 17 квітня, Google випустила Gemini 2.5 Flash — модель міркування, яка відповідає або перевершує рівню DeepSeek-R1 з точки зору продуктивності за нижчої вартості вхідних токенів.

В електронному листі для клієнтів OpenAI зазначає, що розробники, які хочуть використовувати модель o3 через API, повинні будуть пройти нещодавно введений процес ідентифікації. За словами представників OpenAI, така перевірка призначена для того, щоб зловмисники не порушували політику використання.

Останні статті

Середній вік співробітників IT-компаній зріс на 5 років, кількість зумерів скоротилась вдвічі

Співробітників IT-компаній віком від 21 до 25 років за два з половиною роки поменшало вдвічі,…

08.09.2025

IT-фахівці в ЗСУ поділились своїми найбільшими проблемами

Опитування, проведене серед 144 IT-спеціалістів, які зараз перебувають в Силах оборони України, виявило, що найбільше…

08.09.2025

Google нарешті озвучує ліміти використання Gemini

Google оновила на своєму сайті розділ Центр довідки, в якому детально описані обмеження Gemini для…

08.09.2025

Кирило Буданов пообіцяв зламати новий російський месенджер MAX

Керівник Головного управління розвідки Міністерства оборони Кирило Буданов запевнив, що новий російський месенджер MAX від…

08.09.2025

Користувачі GitHub обурені «примусовою» інтеграцією Copilot

Серед розробників програмного забезпечення, які використовують платформу GitHub, зріє невдоволення «примусовою» інтеграцією інструмента кодування Copilot.…

08.09.2025

Міноборони розширило функціонал мобільного додатку Резерв+

Міністерство оборони України розширило можливість сплати штрафів через мобільний додаток Резерв+. Тепер у ньому можна…

05.09.2025