Рубріки: Новини

Чат-бот можна обманути, встановивши йому фальшиві спогади — дослідники Принстонського університету

Дмитро Сімагін

Дослідники з Принстонського університету попереджають про «недосліджені ризики безпеки» з боку агентів штучного інтелекту, якщо вони використовуються для автоматизованих фінансових операцій. Це стверджується в нещодавно опублікованій статті під назвою «Справжні агенти ШІ з фальшивими спогадами: фатальні атаки маніпуляції контекстом на агентів Web3».

Вчені виявили, що використання агентів ШІ для прийому платежів або торгівлі на біржах несе надзвичайну небезпеку. Справа в тому, що ці агенти вразливі до досить простих швидких маніпуляцій, пов’язаних із встановленням фальшивих спогадів.

Дослідники наводять реальний приклад використання агентів штучного інтелекту на базі ElizaOS. Команда з Принстона надає детальний аналіз своєї «атаки маніпуляції контекстом», а потім перевіряє ефективність атаки.

У діалозі з ботом хакер публікує речення з наказом завжди перераховувати криптовалюту на визначену адресу. Після цього цей наказ приховується нібито підтвердженням від бота та стороннім запитанням, на яке відповідає вже справжній бот. В історії діалогу фіксується не тільки запитання та відповідь, але й наказ перерахувати гроші на адресу хакера. Як не дивно, але така проста маніпуляція заплутує ШІ-агента.

ElizaOS — це фреймворк для створення агентів, які використовують великі мовні моделі для виконання різних транзакцій на основі блокчейну від імені користувача за попередньо визначеними правилами. Його представили в жовтні 2024 року під назвою Ai16z, потім його перейменували на ElizaOS.

ElizaOS може підключатися до сайтів соціальних мереж або приватних платформ та очікувати інструкцій або від особи, яку вона запрограмована представляти, або від покупців, продавців чи трейдерів, які хочуть укладати транзакції з кінцевим користувачем. За цією моделлю агент на базі ElizaOS може здійснювати або приймати платежі та виконувати інші дії на основі набору попередньо визначених правил.

Останні статті

OpenAI випустила гайд для розробників, як писати промпти з GPT-5.1

Компанія OpenAI опублікувала розширений посібник для розробників з рекомендаціями застосування нової LLM-моделі GPT-5.1. В документі…

17.11.2025

PyPI посилює перевірку користувачів після зміни пристрою авторизації

Розробники репозиторію Python-пакетів PyPI (Python Package Index) запровадили додаткову перевірку під час авторизації. Тепер від…

17.11.2025

Новий сервіс Code Wiki від Google сам пише та оновлює документацію для GitHub-репозиторіїв

Компанія Google представила новий проект Code Wiki — сервіс, який автоматично генерує технічну документацію для…

17.11.2025

В оновленому Visual Studio Code з’явився Agent HQ — центр управління агентами кодування

Редактор коду Visual Studio Code отримав чергове оновлення. У релізі 1.106 з'явився Agent HQ —…

17.11.2025

ІТ-компанії, засновані українцями в США, генерують $23,2 млрд доходу і створили 130 000 робочих місць

Американські компанії, засновані вихідцями з України, генерують майже $60 млрд річного доходу в США та…

17.11.2025

Microsoft заблокувала популярний спосіб офлайн-активації Windows

Microsoft відключила один із найвідоміших «напівлегальних» способів активації Windows — офлайн-метод KMS38. Він дозволяв продовжувати…

14.11.2025