Британський інститут безпеки штучного інтелекту (AISI) опублікував тривожне дослідження: сучасні моделі вже здатні самостійно проводити кібератаки — і їхні можливості зростають з шаленою швидкістю.
Одним з головних завдань дослідження був вимір, завдання якої складності штучний інтелект може виконати самостійно. Складність вимірюється в часі — скільки годин знадобилося б досвідченому фахівцю з кібербезпеки на те саме завдання.
Ключове питання: наскільки «довгі» й складні операції ШІ може виконувати з 80% надійністю?
Як виявилось, цей показник подвоюється кожні кілька місяців:
Обидві моделі тестувалися на так званих «кіберрейнджах» — симульованих корпоративних мережах, де ШІ має провести повноцінну атаку крок за кроком. Перший рейндж, «The Last Ones», — це 32-крокова атака на корпоративну мережу.
| Claude Mythos Preview | GPT-5.5 | |
|---|---|---|
| «The Last Ones» | 6 з 10 спроб ✅ | 3 з 10 спроб ✅ |
| «Cooling Tower» | 3 з 10 спроб ✅ | ❌ не пройшов |
| Довгі завдання (8+ год) | 100% успіх | 100% на 5 із 6 |
Головний результат: Claude Mythos Preview — перша модель, що пройшла «Cooling Tower». До цього жодна модель навіть близько не підходила.
Важливий нюанс: у звіті мова йде про новіший чекпоінт Mythos Preview, не той, що тестувався раніше. Тобто стрибок стався між двома ітераціями одного релізу — без окремого анонсу нової моделі.
Без ліміту токенів GPT-5.5 закриває і шостий довгий таск зі 100%. Обидві моделі впираються в стелю того, що поточний сюїт взагалі може виміряти.
Поки більшість людей думає про штучний інтелект як про чат-бота, який пише листи й малює картинки, паралельно відбувається інша гонка. Та сама технологія вчиться:
Раніше такі дії потребували команди висококваліфікованих хакерів із тижнями роботи. Сьогодні ШІ робить це автономно.
Дослідники підкреслюють: штучний інтелект — це інструмент з двома лезами. Ті самі моделі допомагають знаходити й закривати вразливості швидше, ніж будь-коли раніше. Фахівці з кібербезпеки вже повідомляють про значний прогрес у виявленні загроз завдяки новим моделям.
Але є критичне вікно: можливості атаки розвиваються дуже швидко, і організаціям потрібно вже зараз інвестувати в базову кібергігієну — до того, як ці інструменти стануть загальнодоступними.
AISI чесно визнає: невідомо, чи є стрибок Claude Mythos і GPT-5.5 початком нового, ще швидшого тренду — чи тимчасовим викидом. Наступні моделі покажуть.
Поки що факт залишається фактом: autonomous AI cyber capability advancing — і це вже не теорія.
Нагадаємо, що адміністрація Трампа заблокувала плани Anthropic розширити доступ до Claude Mythos.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Користувач під ніком cprkrn поділився у соцмережі X неймовірною історією: ШІ-інструмент Claude Code допоміг йому…
Варшава не має наміру відмовлятися від оподаткування цифрових платформ — навіть під тиском адміністрації Трампа.…
Переговори між Samsung Electronics та найбільшою профспілкою компанії зайшли у глухий кут. У середу, 13…
Індонезійський острів Балі більше не є безпечним раєм для тих, хто поєднує роботу з відпочинком.…
Компанія Google анонсувала нову функцію Create My Widget для Android, яка дозволяє користувачам створювати власні…
Голлівудські актори перейшли від слів до дій у боротьбі з неконтрольованим використанням штучного інтелекту в…