Рубріки: Новини

Розробники платять більше за використання ШІ, хоча ціна токенів знижується

Дмитро Сімагін

Хоча вартість токенів доступу до моделей штучного інтелекту щороку знижується приблизно в 10 разів, це ніяк не відображається на економії коштів розробників. Навпаки, поява технології «міркування» призвела до того, що витрати за використання LLM-моделей зросли, пише The Wall Street Journal.

Обмірковуючи, як краще виконати завдання, сучасні моделі та агенти повторно виконують запити, щоб перевірити свої відповіді, звертаються до веб-джерел, щоб зібрати додаткову інформацію, і навіть пишуть власні невеликі програми для обчислення. Це може займати хвилини або навіть години. У підсумку вони надають більш точні відповіді, але витрачають набагато більше токенів у процесі роботи. 

Ось приблизна кількість токенів доступу до LLM, необхідних для завдань різного рівня:

  • Базові запитання та відповіді чат-бота: від 50 до 500 токенів.
  • Короткий опис документа: від 200 до 6000 токенів.
  • Базова допомога з кодом: від 500 до 2000 токенів.
  • Написання  складного коду: від 20 000 до 100 000+ токенів.
  • Аналіз юридичних документів: від 75 000 до 250 000+ токенів.
  • Багатоетапний робочий процес агента: від 100 000 до 1 мільйона+ токенів.

Найдешевші моделі штучного інтелекту, включаючи нову GPT-5 Nano від OpenAI, зараз коштують близько 10 центів за 1 мільйон токенів. Доступ до повноцінної моделі GPT-5 коштує близько $3,44 за мільйон токенів, якщо використовувати середньозважене значення для моделей використання.

Незважаючи на те, що постачальники доступу до LLM, включаючи Cursor та Replit, нещодавно скоригували свої ціни в бік зниження, користувачі стали витрачати більше. Деякі розробники, які працюють з інструментом Cursor, виявили, що вони витрачають місячний запас кредитів за лічені дні. 

Тео Браун, виконавчий директор T3 Chat, вважає, що одним з варіантів вирішення проблеми надмірної витрати коштів може стати перехід на дешевші, менш потужні моделі, які потребують менше ресурсів.

Останні статті

У КПІ будуть викладати «Програмування комп’ютерних ігор» за підтримки GSC Game World

Київський політехнічний інститут (КПІ) та найвідоміша українська геймдев-студія GSC Game World, розробник гри S.T.A.L.K.E.R. 2:…

28.11.2025

Хакери модифікували GPT для розробки шкідливих скриптів та проведення фішингових атак

Дослідники Unit42 з Palo Alto Networks проаналізували дві кастомні LLM-моделі, створені на базі GPT: WormGPT…

28.11.2025

Команда мови програмування Zig відмовляється від GitHub на користь Codeberg

Репозиторій мови Zig мігрує з GitHub до Codeberg, некомерційної компанії з хостингу Git, яка базується…

28.11.2025

Google обмежує безкоштовний доступ до Gemini 3 Pro через «високий попит»

Google запроваджує обмеження для безкоштовних користувачів на доступ до LLM-моделі Gemini 3 Pro та генератора…

28.11.2025

Українським IT-фахівцям треба готуватись до збільшення податків: уряд погодився на умови МВФ

Кабінет міністрів України погодився з пропозицією скасувати податкові пільги в обмін на новий пакет фінансування…

28.11.2025

Microsoft працює над новим способом оновлення програм із Microsoft Store

Останні preview-збірки Windows 11 демонструють, що Microsoft готує новий спосіб оновлення програм з каталогу Microsoft…

27.11.2025