Компанія Anthropic оголосила про запуск Claude 4 — першої великої модернізації свого флагманського ШІ після сімейства Claude 3. Моделі Opus 4 і Sonnet 4 орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».
Найкраще кодування на ринку. Внутрішні тестування Anthropic показують, що Opus 4 перевершує Google Gemini 2.5 Pro, OpenAI o3 Reasoning і GPT-4.1 у задачах програмування та використання зовнішніх інструментів.
Довга автономна робота. У випробуваннях для корпоративних клієнтів модель самостійно рефакторила великий код протягом семи годин без втручання людини.
Агентність, перевірена Pokémon. Opus 4 зміг безперервно грати у Pokémon Red 24 години, тоді як попередня версія трималася лише 45 хвилин — показник покращеної пам’яті та планування.
Sonnet 4 замінює версію 3.7 як універсальний помічник: він дешевший, але успадковує більшість інтелектуальних покращень Opus, зокрема на 65% меншу схильність до «лайф-хаків» (reward hacking) і точніше зберігання контексту при довгих сесіях.
Користувачі можуть перемикати модель між «швидкою відповіддю» й «глибоким розмірковуванням» (extended thinking), а короткі «thinking summaries» пояснюють логіку кроків Claude, роблячи роботу агресивно-тривалих агентів прозорішою.
Через підвищену потужність Opus 4 Anthropic вперше активувала для нього рівень захисту AI Safety Level 3: посилена кібербезпека, анти-джейлбрейк-класифікатори, програма винагород за вразливості та політика Responsible Scaling Policy. Sonnet 4 залишився у рамці ASL-2.
Модель | Вхідні токени | Вихідні токени | Де доступна |
---|---|---|---|
Claude 4 Opus | $15 / млн | $75 / млн | Anthropic API, Amazon Bedrock, Google Vertex AI; плани Pro/Max/Team/Enterprise |
Claude 4 Sonnet | $3 / млн | $15 / млн | Ті самі сервіси; також у безкоштовному плані Claude |
Запуск Claude 4 зміщує фокус від розмовних чат-ботів до «віртуальних співпрацівників», здатних годинами виконувати складні робочі процеси — від масового рефакторингу коду до управління маркетинговими кампаніями. Аналітики очікують, що конкуренти (OpenAI, Google, Meta) пришвидшать власні оновлення, аби наздогнати агентну продуктивність Opus 4.
Журналістка в якості експерименту провела два дні в офісі IT-компанії Notion, де спробувала себе у…
Найбільший єдиноріг з українським корінням, Grammarly, незабаром змінить назву і перетвориться із сервісу перевірки граматики…
48% українських IT-фахівців (у 2024 — 51%) готуються емігрувати або думають про це без наявності…
Компанія Microsoft почала тестувати нову функцію Windows 11, яка дозволяє переносити сеанс роботи з Android-програмою…
Ілон Маск заявив, що його компанія xAI відкрила код LLM-моделі Grok 2.5. Завантажити її можна…
Генеральний директор криптовалютної біржі Coinbase Браян Армстронг розповів, що нещодавно звільнив програмістів, які ще не…