Розробники платять більше за використання ШІ, хоча ціна токенів знижується
Хоча вартість токенів доступу до моделей штучного інтелекту щороку знижується приблизно в 10 разів, це ніяк не відображається на економії коштів розробників. Навпаки, поява технології «міркування» призвела до того, що витрати за використання LLM-моделей зросли, пише The Wall Street Journal.
Обмірковуючи, як краще виконати завдання, сучасні моделі та агенти повторно виконують запити, щоб перевірити свої відповіді, звертаються до веб-джерел, щоб зібрати додаткову інформацію, і навіть пишуть власні невеликі програми для обчислення. Це може займати хвилини або навіть години. У підсумку вони надають більш точні відповіді, але витрачають набагато більше токенів у процесі роботи.
Ось приблизна кількість токенів доступу до LLM, необхідних для завдань різного рівня:
Найдешевші моделі штучного інтелекту, включаючи нову GPT-5 Nano від OpenAI, зараз коштують близько 10 центів за 1 мільйон токенів. Доступ до повноцінної моделі GPT-5 коштує близько $3,44 за мільйон токенів, якщо використовувати середньозважене значення для моделей використання.
Незважаючи на те, що постачальники доступу до LLM, включаючи Cursor та Replit, нещодавно скоригували свої ціни в бік зниження, користувачі стали витрачати більше. Деякі розробники, які працюють з інструментом Cursor, виявили, що вони витрачають місячний запас кредитів за лічені дні.
Тео Браун, виконавчий директор T3 Chat, вважає, що одним з варіантів вирішення проблеми надмірної витрати коштів може стати перехід на дешевші, менш потужні моделі, які потребують менше ресурсів.
За підсумками серпня в Україні зареєстрували діяльність 3534 IT-суб’єкти, серед яких компанії та ФОПи. Одночасно…
Компанія Course Report, яка відстежує індустрію IT-освіти, проаналізувала понад 12 мільйонів оголошень про вакансії на…
Компанія Ілона Маска xAI подала до суду на свого колишнього розробника, який нібито вкрав службову…
Anthropic тестує і незабаром планує випустити версію Claude Code у вигляді веб-додатку. Він може бути…
Компанія Google оголосила про інтеграцію агента на базі штучного інтелекту Gemini CLI з редактором коду…
OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.…