Компанія Anthropic оголосила про запуск Claude 4 — першої великої модернізації свого флагманського ШІ після сімейства Claude 3. Моделі Opus 4 і Sonnet 4 орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».
Найкраще кодування на ринку. Внутрішні тестування Anthropic показують, що Opus 4 перевершує Google Gemini 2.5 Pro, OpenAI o3 Reasoning і GPT-4.1 у задачах програмування та використання зовнішніх інструментів.
Довга автономна робота. У випробуваннях для корпоративних клієнтів модель самостійно рефакторила великий код протягом семи годин без втручання людини.
Агентність, перевірена Pokémon. Opus 4 зміг безперервно грати у Pokémon Red 24 години, тоді як попередня версія трималася лише 45 хвилин — показник покращеної пам’яті та планування.
Sonnet 4 замінює версію 3.7 як універсальний помічник: він дешевший, але успадковує більшість інтелектуальних покращень Opus, зокрема на 65% меншу схильність до «лайф-хаків» (reward hacking) і точніше зберігання контексту при довгих сесіях.
Користувачі можуть перемикати модель між «швидкою відповіддю» й «глибоким розмірковуванням» (extended thinking), а короткі «thinking summaries» пояснюють логіку кроків Claude, роблячи роботу агресивно-тривалих агентів прозорішою.
Через підвищену потужність Opus 4 Anthropic вперше активувала для нього рівень захисту AI Safety Level 3: посилена кібербезпека, анти-джейлбрейк-класифікатори, програма винагород за вразливості та політика Responsible Scaling Policy. Sonnet 4 залишився у рамці ASL-2.
| Модель | Вхідні токени | Вихідні токени | Де доступна |
|---|---|---|---|
| Claude 4 Opus | $15 / млн | $75 / млн | Anthropic API, Amazon Bedrock, Google Vertex AI; плани Pro/Max/Team/Enterprise |
| Claude 4 Sonnet | $3 / млн | $15 / млн | Ті самі сервіси; також у безкоштовному плані Claude |
Запуск Claude 4 зміщує фокус від розмовних чат-ботів до «віртуальних співпрацівників», здатних годинами виконувати складні робочі процеси — від масового рефакторингу коду до управління маркетинговими кампаніями. Аналітики очікують, що конкуренти (OpenAI, Google, Meta) пришвидшать власні оновлення, аби наздогнати агентну продуктивність Opus 4.
Google має намір об'єднати операційні системи ChromeOS та Android в єдину платформу для настільних комп'ютерів…
OpenAI додала в ChatGPT нову функцію «дослідження покупок», яка допоможе користувачам у процесі обрання найкращого…
Дослідження компанії кібербезпеки CrowdStrike показало, що LLM-модель DeepSeek-R1 створює більше вразливостей безпеки в коді, якщо…
Amazon пропонує своїм розробникам відмовитися від інструментів генерації коду від сторонніх компаній на користь власного…
Anthropic випустила нову LLM-модель Claude Opus 4.5. Стверджується, що це найкраща модель у світі для…
Інструмент кодування LingGuang від китайської компанії Ant Group менше ніж за тиждень досяг першого мільйона…