«Claude cпочатку відмовлявся та заперечував»: хакер змусив LLM стати його спільником у нападі на уряд Мексики
Невідомий хакер використав модель штучного інтелекту Claude для серії атак на державні установи Мексики. За словами дослідників з кібербезпеки компанії Gambit Security, протягом місяця, починаючи з грудня, хакер разом із Claude шукав вразливості в урядових мережах і писав комп’ютерні скрипти для визначення способів автоматизації крадіжки даних. Про це повідомляє Venture Beat.
В результаті було викрадено 150 гігабайт даних уряду Мексики, включаючи 195 мільйонів документів з переліком платників податків і виборців, посвідчення державних службовців та файли цивільного реєстрації.
Зловмисник створив серію підказок, що пропонували Claude діяти як легальний багхантер — тестувальник, який шукає помилки в коді, щоб отримати винагороду від компанії. Спочатку Claude відмовлявся. Коли хакер додав правила щодо видалення логів та історії команд, чат-бот заперечив ще більше. Очевидно, він зрозумів, що його намагаються втягнути в незаконну діяльність.
«Конкретні інструкції щодо видалення журналів та приховування історії є тривожними сигналами. Для отримання законної винагороди за виявлення помилок вам не потрібно приховувати свої дії»,— відповів Claude, згідно зі стенограмою Gambit Security.
Після цього хакер припинив переговори зі штучним інтелектом і обрав інший підхід: передав моделі детальний посібник з поетапних дій. Цей метод виявився успішним.
«Загалом було створено тисячі детальних інструкцій, які містили готові до виконання плани. В цих інструкціях штучний інтелект повідомляв оператору-людині, які саме внутрішні цілі атакувати далі та які облікові дані використовувати», — пояснює Кертіс Сімпсон, головний стратегічний директор Gambit Security.
Коли Claude зіткнувся з труднощами, хакер звернувся за допомогою до ChatGPT, який пояснив, як досягти латерального руху та оптимізації зіставлення облікових даних. Далі зловмисник постійно запитував Claude, де ще знайти дані для входу в урядові системи, які з них краще обрати та де ще може зберігатися цінна інформація.
Фахівці Gambit не пов’язують цю атаку з якоюсь конкретною групою. Також малоймовірно, що кіберзлочинець був пов’язаний з іноземним урядом.
Нагадаємо, що зараз спостерігається новий вірусний тренд: ChatGPT створює карикатури на власника акаунту на основі його запитів.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Компанія Google представила Nano Banana 2 (офіційна назва — Gemini 3.1 Flash Image). Це нове…
Google оголосила про масштабне оновлення свого сервісу перекладу, додаючи в Translate нові алгоритми штучного інтелекту…
Служба безпеки створила регіональні центри кібербезпеки в усіх областях України. Їхня мета полягає в завчасному…
Інструмент Cowork, який є спрощеним аналогом Claude Code для загальних завдань, а не лише для…
Все йде до того, що Ілон Маск, схоже, програє справу проти OpenAI. Нагадаємо, кілька місяців…
Компанія Alibaba Cloud оголосила про запуск Coding Plan — дворівневої підписки на доступ до LLM-моделей…