Claude Mythos: перша інформація про майбутню флагманську модель Anthropic
Після витоку внутрішніх даних Anthropic офіційно підтвердила факт тестування своєї найбільш амбітної моделі під кодовою назвою Mythos. Згідно з заявою представника компанії, Mythos є «найпотужнішою з усіх LLM, що ми створили на сьогоднішній день», пише Fortune
Підтвердження моделі відбулося після того, як в інтернет потрапили фрагменти документації щодо її навчання. У чернетці допису йшлося про те, що нова модель називається Claude Mythos і що компанія вважає, що вона створює безпрецедентні ризики для кібербезпеки.

Окрім посилання на Mythos, у розкритому для публіки дописі також обговорювалась нова серія LLM, яка називатиметься Capybara. У документі Anthropic зазначається, що моделі серії Capybara стануть більш розумні, ніж моделі Opus, які досі вважаються найкращими LLM.
Наразі Anthropic має три серії моделей: найбільші та найпотужніші версії називаються Opus; трохи швидші та дешевші, але менш потужні версії називаються Sonnet; найменші, найдешевші та найшвидші називаються Haiku.
«Порівняно з нашою попередньою найкращою моделлю, Claude Opus 4.6, Capybara отримує значно вищі бали в тестах на програмне кодування, академічне мислення та кібербезпеку, серед іншого», — йдеться в блозі компанії.
Mythos на базі Capybara позиціонується як пряма відповідь на останні релізи OpenAI (серія GPT-5.x) та прогрес DeepSeek у галузі дистиляції моделей. Очікується, що Mythos перевершить Opus 4.6 у завданнях:
- Agentic Workflows: Глибока інтеграція з операційними системами та інструментами розробки (computer use).
- Context Precision: Робота з контекстними вікнами понад 1 млн токенів без втрати точності (needle-in-a-haystack).
- Logic & Math: Вирішення задач рівня ARC-AGI 3.
Що стосується API та міграції, то Anthropic планує зберегти сумісність з існуючим Messages API, але для Mythos можуть бути введені нові параметри.
Через складність архітектури Mythos на початкових етапах буде дорожчою за Claude Opus, проте компанія працює над оптимізацією вартості для комерційних клієнтів.
Чому це важливо для IT-ринку?
Якщо Mythos дійсно забезпечує обіцяний «стрибок», то ми побачимо перехід від чат-ботів до повноцінних автономних агентів кодування, здатних самостійно підтримувати репозиторії та розгортати інфраструктуру. Для технічних лідерів це сигнал до перегляду стеків автоматизації та інвестицій у пайплайни, орієнтовані на агентні архітектури.
Зараз модель Mythos перебуває на стадії внутрішнього червоного тестування (red-teaming). Орієнтовне вікно релізу для Early Access — другий квартал 2026 року.
Нагадаємо, кілька тижнів тому Anthropic представила новий інструмент перевірки пул-реквестів під назвою Code Review.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn












Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: