Рубріки: Новини

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Олександр Остапенко

Компанія Anthropic вирішила відкласти публічний реліз своєї найновішої LLM-моделі Claude Mythos через побоювання, що вона занадто добре знаходить критичні вразливості в операційних системах та браузерах.

«Значне розширення можливостей попередньої версії Claude Mythos змусило нас вирішити не робити її загальнодоступною», — йдеться в заяві Anthropic. 

Представник Anthropic детально описав низку тривожних висновків про роботу нової моделі. Вона не тільки легко знаходить вразливості в надійних перевірених системах, але й може вийти з віртуальної «пісочниці», що робить LLM потенційно небезпечною.

Під час одного з експериментів дослідник поставив перед Mythos завдання надіслати йому повідомлення, якщо вона може втекти з пісочниці. «Дослідник дізнався про успіше виконання завдання, отримавши неочікуваний електронний лист від моделі, коли їв бутерброд у парку», — пишуть в Anthropic.

Вражаючу потужність Mythos демонструє факт того, що модель самостійно знайшла 27-річну вразливість у OpenBSD — системі, яка вважається однією з найзахищеніших у світі.

Особливе занепокоєння викликає той факт, що нова LLM дозволяє навіть «неекспертам» створювати шкідливі експлойти.

«Інженери Anthropic без формальної підготовки з безпеки просили Mythos Preview знайти вразливості віддаленого виконання коду протягом ночі, а наступного ранку прокидалися з повністю робочим експлойтом», – написала команда Frontier Red з Anthropic у блозі. 

Що стосується порівняння Mythos з найкращою на сьогоднішній день моделлю штучного інтелекту Claude Opus 4.6, то вони теж вражають:

Показник Claude Opus 4.6 Claude Mythos
Відтворення вразливостей (CyberGym) 66.6% 83.1%
Кодинг (SWE-bench Pro) 53.4% 77.8%
Логіка та міркування (Terminal-Bench) 65.4% 82.0%

Тепер в Anthropic заявили, що компанія вирішила не публікувати Mythos публічно. Натомість вони сподіваються випустити «моделі класу Mythos» після того, як буде вжито належних заходів безпеки.

Нагадаємо, що в Copilot тепер можна одночасно використовувати моделі Anthropic та OpenAI.

Останні статті

Журналісти The New York Times стверджують, що розкрили особистість Сатоші Накамото

Нові методи порівняльного аналізу стилю письма, біографічних та інших даних дають підстави стверджувати, що легендарний…

08.04.2026

GitHub Copilot CLI: тепер з підтримкою «агента огляду» Rubber Duck

GitHub офіційно розширює можливості Copilot у терміналі, впроваджуючи підтримку різних сімейств моделей. Це дозволяє розробникам…

07.04.2026

Вдень — на зйомках, вночі пише код: акторка Мілла Йовович виклала власний ШІ-інструмент на GitHub

Голлівудська акторка Мілла Йовович вирішила внести свою лепту в розробку систем штучного інтелекту. Знаменита уродженка…

07.04.2026

800 000 робочих місць: як IT впливає на економіку України

Поки світ обговорює нові LLM-моделі, українське IT доводить свою ефективність не словом, а гривнею. Хоча…

07.04.2026

Голодні ігри за токени: «Дехто залишає агентів працювати годинами, щоб штучно завищити свої показники»

Компанія Meta знайшла незвичний спосіб стимулювати своїх співробітників активніше використовувати штучний інтелект. В середині корпоративної…

07.04.2026

У Google Play з’явився пошук по відгуках: як він працює

Google офіційно запускає корисне оновлення для свого магазину додатків, яке значно спростить вибір програм та…

07.04.2026