Рубріки: Новини

Чат-бот можна обманути, встановивши йому фальшиві спогади — дослідники Принстонського університету

Дмитро Сімагін

Дослідники з Принстонського університету попереджають про «недосліджені ризики безпеки» з боку агентів штучного інтелекту, якщо вони використовуються для автоматизованих фінансових операцій. Це стверджується в нещодавно опублікованій статті під назвою «Справжні агенти ШІ з фальшивими спогадами: фатальні атаки маніпуляції контекстом на агентів Web3».

Вчені виявили, що використання агентів ШІ для прийому платежів або торгівлі на біржах несе надзвичайну небезпеку. Справа в тому, що ці агенти вразливі до досить простих швидких маніпуляцій, пов’язаних із встановленням фальшивих спогадів.

Дослідники наводять реальний приклад використання агентів штучного інтелекту на базі ElizaOS. Команда з Принстона надає детальний аналіз своєї «атаки маніпуляції контекстом», а потім перевіряє ефективність атаки.

У діалозі з ботом хакер публікує речення з наказом завжди перераховувати криптовалюту на визначену адресу. Після цього цей наказ приховується нібито підтвердженням від бота та стороннім запитанням, на яке відповідає вже справжній бот. В історії діалогу фіксується не тільки запитання та відповідь, але й наказ перерахувати гроші на адресу хакера. Як не дивно, але така проста маніпуляція заплутує ШІ-агента.

ElizaOS — це фреймворк для створення агентів, які використовують великі мовні моделі для виконання різних транзакцій на основі блокчейну від імені користувача за попередньо визначеними правилами. Його представили в жовтні 2024 року під назвою Ai16z, потім його перейменували на ElizaOS.

ElizaOS може підключатися до сайтів соціальних мереж або приватних платформ та очікувати інструкцій або від особи, яку вона запрограмована представляти, або від покупців, продавців чи трейдерів, які хочуть укладати транзакції з кінцевим користувачем. За цією моделлю агент на базі ElizaOS може здійснювати або приймати платежі та виконувати інші дії на основі набору попередньо визначених правил.

Останні статті

У ChatGPT може з’явитись реклама

Компанія OpenAI розглядає додаткові способи отримання доходу, одним з яких є розміщення реклами в ChatGPT.…

15.08.2025

GitHub додає підтримку BMP і TIFF, але все ще не розпізнає WebP та AVIF як зображення

Платформа спільної розробки та хостингу коду GitHub дозволила завантажувати додаткові типи файлів до задач, запитів…

15.08.2025

Китайська влада наполягла, щоб DeepSeek навчала модель R2 на обладнанні Huawei. Але щось пішло не так

Провідний китайський стартап у сфері штучного інтелекту DeepSeek був змушений відкласти випуск своєї майбутньої моделі…

15.08.2025

Google випустила мініатюрну модель Gemma 3 270M — її можна запустити на смартфоні

Google представила компактну версію своєї відкритої моделі Gemma, розроблену для роботи на локальних пристроях, включно…

15.08.2025

Керівник Мінцифри розповів про нові послуги в «Дії», які з’являться восени

Перший віце-прем’єр-міністр та очільник Мінцифри Михайло Федоров під час вчорашнього стріму в Тік-Ток розповів, що…

15.08.2025

В Google Translate додали функцію вивчення іноземних мов

Додаток Google Translate отримав нову функцію Practice для вивчення іноземних мов. Про це повідомляє Android…

14.08.2025