Рубріки: Новини

Розробники платять більше за використання ШІ, хоча ціна токенів знижується

Дмитро Сімагін

Хоча вартість токенів доступу до моделей штучного інтелекту щороку знижується приблизно в 10 разів, це ніяк не відображається на економії коштів розробників. Навпаки, поява технології «міркування» призвела до того, що витрати за використання LLM-моделей зросли, пише The Wall Street Journal.

Обмірковуючи, як краще виконати завдання, сучасні моделі та агенти повторно виконують запити, щоб перевірити свої відповіді, звертаються до веб-джерел, щоб зібрати додаткову інформацію, і навіть пишуть власні невеликі програми для обчислення. Це може займати хвилини або навіть години. У підсумку вони надають більш точні відповіді, але витрачають набагато більше токенів у процесі роботи. 

Ось приблизна кількість токенів доступу до LLM, необхідних для завдань різного рівня:

  • Базові запитання та відповіді чат-бота: від 50 до 500 токенів.
  • Короткий опис документа: від 200 до 6000 токенів.
  • Базова допомога з кодом: від 500 до 2000 токенів.
  • Написання  складного коду: від 20 000 до 100 000+ токенів.
  • Аналіз юридичних документів: від 75 000 до 250 000+ токенів.
  • Багатоетапний робочий процес агента: від 100 000 до 1 мільйона+ токенів.

Найдешевші моделі штучного інтелекту, включаючи нову GPT-5 Nano від OpenAI, зараз коштують близько 10 центів за 1 мільйон токенів. Доступ до повноцінної моделі GPT-5 коштує близько $3,44 за мільйон токенів, якщо використовувати середньозважене значення для моделей використання.

Незважаючи на те, що постачальники доступу до LLM, включаючи Cursor та Replit, нещодавно скоригували свої ціни в бік зниження, користувачі стали витрачати більше. Деякі розробники, які працюють з інструментом Cursor, виявили, що вони витрачають місячний запас кредитів за лічені дні. 

Тео Браун, виконавчий директор T3 Chat, вважає, що одним з варіантів вирішення проблеми надмірної витрати коштів може стати перехід на дешевші, менш потужні моделі, які потребують менше ресурсів.

Останні статті

В Україні побільшало фізичних осіб і компаній, які працюють в IT

За підсумками серпня в Україні зареєстрували діяльність 3534 IT-суб’єкти, серед яких компанії та ФОПи. Одночасно…

01.09.2025

Названо найбільш затребувану навичку в IT-вакансіях. І це не Python

Компанія Course Report, яка відстежує індустрію IT-освіти, проаналізувала понад 12 мільйонів оголошень про вакансії на…

01.09.2025

Колишнього розробника xAI звинуватили в крадіжці комерційної таємниці для OpenAI

Компанія Ілона Маска xAI подала до суду на свого колишнього розробника, який нібито вкрав службову…

01.09.2025

Anthropic тестує веб-додаток Claude Code

Anthropic тестує і незабаром планує випустити версію Claude Code у вигляді веб-додатку. Він може бути…

01.09.2025

Агент Gemini CLI інтегровано в редактор коду Zed

Компанія Google оголосила про інтеграцію агента на базі штучного інтелекту Gemini CLI з редактором коду…

29.08.2025

OpenAI випустила нову голосову модель і знизила ціни на 20%

OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.…

29.08.2025