Рубріки: Новини

В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini

Дмитро Сімагін

18.04.2025 09:47

OpenAI запускає Flex processing — нову опцію API, завдяки якій можна суттєво зекономити на використання моделей штучного інтелекту в обмін на повільний час відгуку та «тимчасову недоступність ресурсів».

Як пояснюють на сайті OpenAI, Flex processing доступна в бета-версії для нещодавно випущених моделей міркувань o3 і o4-mini. Опція спрямована на виконання завдань з нижчим пріоритетом і «невиробничих» завдань, таких як оцінювання моделей, збагачення даних і асинхронні робочі навантаження.

Використання Flex processing зменшує витрати на API рівно вдвічі. Для o3 застосування Flex processing дає остаточну вартість роботи з моделлю на рівні $5/млн вхідних токенів (~750 000 слів) і $20/млн вихідних токенів. Стандартні ціні на використання o3 через API становлять $10/млн вхідних токенів і $40/млн вихідних токенів. Для o4-mini Flex знижує ціну до $0,55/млн вхідних токенів і $2,20/млн вихідних токенів, тоді як стандартна ціна становить $1,10/млн вхідних токенів і $4,40/млн вихідних токенів.

Запуск Flex processing стався в той час, коли конкуренти OpenAI випускають дешевші та ефективніші бюджетні моделі. Буквально вчора, 17 квітня, Google випустила Gemini 2.5 Flash — модель міркування, яка відповідає або перевершує рівню DeepSeek-R1 з точки зору продуктивності за нижчої вартості вхідних токенів.

В електронному листі для клієнтів OpenAI зазначає, що розробники, які хочуть використовувати модель o3 через API, повинні будуть пройти нещодавно введений процес ідентифікації. За словами представників OpenAI, така перевірка призначена для того, щоб зловмисники не порушували політику використання.

Наступна стаття Wikipedia випустила спеціальний датасет, щоб відволікти увагу ботів »

попередня стаття « COO Genesis покинув компанію заради роботи над християнським застосунком Duomo

Дмитро Сімагін

Теги: LLM-модельo3openAI

18.04.2025 09:47

Останні статті

Новини

Україна може допомогти Європі зменшити технологічну залежність від США та Китаю — дослідження

Україна здатна допомогти Європейському Союзу зменшити частину його технологічних залежностей від США та Китаю. Про…

02.02.2026

Новини

Anthropic додала агентні плагіни в інструмент автоматизації Cowork

Компанія Anthropic інтегрувала в Cowork агентні плагіни, які дозволяють налаштовувати модель Claude під конкретні корпоративні…

02.02.2026

Новини

Реліз генератора ігрових світів Project Genie від Google обвалив акції геймдев-компаній

Акції найбільших геймдев-компаній обвалились після того, як Google представила нову модель Genie 3 та генератор…

02.02.2026

Новини

«Я створив функцію за два тижні, на яку раніше треба було витратити рік»: розробники Bluesky стверджують, що з традиційним кодуванням «все скінчено»

Опитування професійних розробників соцмережі Bluesky виявило, що більшість з них вважають інструменти штучного інтелекту логічним…

02.02.2026

Новини

У Хмельницькому суд зобов’язав програміста задонатити 100 000 грн на підтримку ЗСУ

Хмельницький міськрайонний суд ухвалив рішення у справі провідного програміста ТОВ «Екзедепт», який намагався за допомогою…

02.02.2026

В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini

Схожі статті

Останні статті

Популярний редактор коду Notepad++ зламано

Україна може допомогти Європі зменшити технологічну залежність від США та Китаю — дослідження

Anthropic додала агентні плагіни в інструмент автоматизації Cowork

Реліз генератора ігрових світів Project Genie від Google обвалив акції геймдев-компаній

«Я створив функцію за два тижні, на яку раніше треба було витратити рік»: розробники Bluesky стверджують, що з традиційним кодуванням «все скінчено»

У Хмельницькому суд зобов’язав програміста задонатити 100 000 грн на підтримку ЗСУ