Рубріки: Новини

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Олександр Остапенко

08.04.2026 09:26

Компанія Anthropic вирішила відкласти публічний реліз своєї найновішої LLM-моделі Claude Mythos через побоювання, що вона занадто добре знаходить критичні вразливості в операційних системах та браузерах.

«Значне розширення можливостей попередньої версії Claude Mythos змусило нас вирішити не робити її загальнодоступною», — йдеться в заяві Anthropic.

Представник Anthropic детально описав низку тривожних висновків про роботу нової моделі. Вона не тільки легко знаходить вразливості в надійних перевірених системах, але й може вийти з віртуальної «пісочниці», що робить LLM потенційно небезпечною.

Під час одного з експериментів дослідник поставив перед Mythos завдання надіслати йому повідомлення, якщо вона може втекти з пісочниці. «Дослідник дізнався про успіше виконання завдання, отримавши неочікуваний електронний лист від моделі, коли їв бутерброд у парку», — пишуть в Anthropic.

Вражаючу потужність Mythos демонструє факт того, що модель самостійно знайшла 27-річну вразливість у OpenBSD — системі, яка вважається однією з найзахищеніших у світі.

Особливе занепокоєння викликає той факт, що нова LLM дозволяє навіть «неекспертам» створювати шкідливі експлойти.

«Інженери Anthropic без формальної підготовки з безпеки просили Mythos Preview знайти вразливості віддаленого виконання коду протягом ночі, а наступного ранку прокидалися з повністю робочим експлойтом», – написала команда Frontier Red з Anthropic у блозі.

Що стосується порівняння Mythos з найкращою на сьогоднішній день моделлю штучного інтелекту Claude Opus 4.6, то вони теж вражають:

Показник	Claude Opus 4.6	Claude Mythos
Відтворення вразливостей (CyberGym)	66.6%	83.1%
Кодинг (SWE-bench Pro)	53.4%	77.8%
Логіка та міркування (Terminal-Bench)	65.4%	82.0%

Тепер в Anthropic заявили, що компанія вирішила не публікувати Mythos публічно. Натомість вони сподіваються випустити «моделі класу Mythos» після того, як буде вжито належних заходів безпеки.

Нагадаємо, що в Copilot тепер можна одночасно використовувати моделі Anthropic та OpenAI.

Наступна стаття Журналісти The New York Times стверджують, що розкрили особистість Сатоші Накамото »

попередня стаття « GitHub Copilot CLI: тепер з підтримкою «агента огляду» Rubber Duck

Олександр Остапенко

Теги: AnthropicClaude MythosLLM-модель

08.04.2026 09:26

Останні статті

Новини

Журналісти The New York Times стверджують, що розкрили особистість Сатоші Накамото

Нові методи порівняльного аналізу стилю письма, біографічних та інших даних дають підстави стверджувати, що легендарний…

08.04.2026

Новини

GitHub Copilot CLI: тепер з підтримкою «агента огляду» Rubber Duck

GitHub офіційно розширює можливості Copilot у терміналі, впроваджуючи підтримку різних сімейств моделей. Це дозволяє розробникам…

07.04.2026

Новини

Вдень — на зйомках, вночі пише код: акторка Мілла Йовович виклала власний ШІ-інструмент на GitHub

Голлівудська акторка Мілла Йовович вирішила внести свою лепту в розробку систем штучного інтелекту. Знаменита уродженка…

07.04.2026

Новини

800 000 робочих місць: як IT впливає на економіку України

Поки світ обговорює нові LLM-моделі, українське IT доводить свою ефективність не словом, а гривнею. Хоча…

07.04.2026

Новини

Голодні ігри за токени: «Дехто залишає агентів працювати годинами, щоб штучно завищити свої показники»

Компанія Meta знайшла незвичний спосіб стимулювати своїх співробітників активніше використовувати штучний інтелект. В середині корпоративної…

07.04.2026

Новини

У Google Play з’явився пошук по відгуках: як він працює

Google офіційно запускає корисне оновлення для свого магазину додатків, яке значно спростить вибір програм та…

07.04.2026

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Схожі статті

Останні статті

Журналісти The New York Times стверджують, що розкрили особистість Сатоші Накамото

GitHub Copilot CLI: тепер з підтримкою «агента огляду» Rubber Duck

Вдень — на зйомках, вночі пише код: акторка Мілла Йовович виклала власний ШІ-інструмент на GitHub

800 000 робочих місць: як IT впливає на економіку України

Голодні ігри за токени: «Дехто залишає агентів працювати годинами, щоб штучно завищити свої показники»

У Google Play з’явився пошук по відгуках: як він працює