Директорка напрямку штучного інтелекту в компанії AMD Стела Лоренцо публічно розкритикувала інструмент Claude Code від Anthropic. За її словами, колись найкращий помічник для програмістів тепер «халтурить» і не справляється зі складними завданнями, пише The Register.
Команда AMD проаналізувала 6852 сеанси роботи Claude Code, які включали 234 760 викликів інструментів та 17 871 блок мислення. Ось що вони виявили:
Проблеми почалися після березневого оновлення. Лоренцо вважає, що в Anthropic почали приховувати внутрішні процеси мислення моделі (thinking blocks).
«Клоду не можна довіряти виконання складних завдань з розробки. Коли мислення стає поверхневим, модель обирає найдешевший шлях: правити без читання та пропонувати найпростіший фікс замість правильного», — написала Лоренцо.
Через падіння якості команда AMD була змушена відмовитися від Claude на користь іншого постачальника обробки даних, назва якого не розголошується.
Лоренцо пропонує додати в Claude Code рівень максимального мислення для розробників, які виконують складні робочі процеси.
«Поточна модель підписки не розрізняє користувачів, яким потрібно 200 токенів мислення за відповідь, і користувачів, яким потрібно 20 000. Користувачі, які виконують складні інженерні робочі процеси, заплатять значно більше за гарантоване глибоке мислення», — пояснює керівник напрямку штучного інтелекту AMD.
Судячи з обговорення в темі проблеми, багато інших коментаторів Reddit висловили схожі почуття.
Нагадаємо, нещодавно компанія OpenAI випустила плагін Codex, який працює в конкуруючому інструменті Claude Code.
Підписуйтесь на наші соцмережі: Telegram | Facebook | LinkedIn
Ринки прогнозів, такі як Polymarket, часто рекламують як «легкий спосіб заробити на власній експертності». Проте…
Дослідники з кібербезпеки Socket виявили масштабну та тривалу кампанію, за якою стоять хакери, пов'язані з…
Компанія Google оголосила про впровадження нової концепції «Блокнотів» (Notebooks) у додатку Gemini. Це рішення покликане…
Відеосервіс YouTube розпочав тестування нової інтелектуальної функції, яка дозволяє автоматично змінювати швидкість відтворення ролика. Проте…
Представники бізнесу, державного сектору та наукової спільноти Японії й України обговорили український досвід створення стійкої…
Ілон Маск продовжує перетворювати X на «застосунок для всього». Сьогодні платформа розпочала масштабне розгортання двох…