Компанія Anthropic оголосила про запуск Claude 4 — першої великої модернізації свого флагманського ШІ після сімейства Claude 3. Моделі Opus 4 і Sonnet 4 орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».
Найкраще кодування на ринку. Внутрішні тестування Anthropic показують, що Opus 4 перевершує Google Gemini 2.5 Pro, OpenAI o3 Reasoning і GPT-4.1 у задачах програмування та використання зовнішніх інструментів.
Довга автономна робота. У випробуваннях для корпоративних клієнтів модель самостійно рефакторила великий код протягом семи годин без втручання людини.
Агентність, перевірена Pokémon. Opus 4 зміг безперервно грати у Pokémon Red 24 години, тоді як попередня версія трималася лише 45 хвилин — показник покращеної пам’яті та планування.
Sonnet 4 замінює версію 3.7 як універсальний помічник: він дешевший, але успадковує більшість інтелектуальних покращень Opus, зокрема на 65% меншу схильність до «лайф-хаків» (reward hacking) і точніше зберігання контексту при довгих сесіях.
Користувачі можуть перемикати модель між «швидкою відповіддю» й «глибоким розмірковуванням» (extended thinking), а короткі «thinking summaries» пояснюють логіку кроків Claude, роблячи роботу агресивно-тривалих агентів прозорішою.
Через підвищену потужність Opus 4 Anthropic вперше активувала для нього рівень захисту AI Safety Level 3: посилена кібербезпека, анти-джейлбрейк-класифікатори, програма винагород за вразливості та політика Responsible Scaling Policy. Sonnet 4 залишився у рамці ASL-2.
Модель | Вхідні токени | Вихідні токени | Де доступна |
---|---|---|---|
Claude 4 Opus | $15 / млн | $75 / млн | Anthropic API, Amazon Bedrock, Google Vertex AI; плани Pro/Max/Team/Enterprise |
Claude 4 Sonnet | $3 / млн | $15 / млн | Ті самі сервіси; також у безкоштовному плані Claude |
Запуск Claude 4 зміщує фокус від розмовних чат-ботів до «віртуальних співпрацівників», здатних годинами виконувати складні робочі процеси — від масового рефакторингу коду до управління маркетинговими кампаніями. Аналітики очікують, що конкуренти (OpenAI, Google, Meta) пришвидшать власні оновлення, аби наздогнати агентну продуктивність Opus 4.
Представник команди Microsoft Windows Реймонд Чен пояснив, як правильно писати коментарі в коді. За його…
Google відкрила доступ до платформи Gemini Enterprise. На ній є готові ШІ-агенти для аналізу даних,…
Компанія Microsoft випустила оновлення програми Copilot для Windows. Нова версія 1.25095.161.0 підтримує Copilot Connections та…
Microsoft додає новий інструмент до оновлення Windows 11 версії 25H2, яке випустили минулого тижня. Мова…
Агентний інструмент генерації коду Codex від компанії OpenAI наздоганяє за певними можливостями аналогічний продукт Claude…
Компанія OpenAI має намір перетворити ChatGPT на повноцінну операційну систему з екосистемою додатків. Про це…