Рубріки: Новини

Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію

Дмитро Сімагін

Компанія Anthropic зіткнулась з негативною реакцією на поведінку своєї нової моделі штучного інтелекту Claude 4 Opus. Як виявили експерти, модель може сама звернутися до преси чи правоохоронних органів, якщо вважає, що власник комп’ютера робить щось «кричуще аморальне». Про це пише Venture Beat.

«Якщо система вважає, що ви робите щось надзвичайно аморальне, наприклад, підробляєте дані у фармацевтичних тестах, вона використовуватиме інструменти командного рядка, щоб зв’язатися з пресою, звернутися до регуляторних органів, спробувати заблокувати ваш доступ до відповідних систем або все це разом», — пише Сем Боумен, дослідник продуктів Anthropic.

На думку експерта, компанія-розробник свідомо створила «режим донесення», намагаючись протидіяти використанню Claude 4 Opus у незаконній діяльності. Наприклад, тепер користувачі не будуть запитувати модель про інструкцію для створення вибухового пристрою, оскільки вони знатимуть, що вона донесе на них в поліцію.

У випадку, якщо Claude 4 Opus «знаходиться в сценаріях, що передбачають кричущі правопорушення з боку користувачів», їй надається доступ до командного рядка та можливість блокування користувачів від систем, до яких модель має доступ. Також вона може масово розсилати електронні листи в ЗМІ та правоохоронним органам для виявлення доказів правопорушень. 

Нагадаємо, що вчора Anthropic представила нове покоління ШІ-моделей Claude Opus 4 та Sonnet 4. Вони орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».

Останні статті

Тести Claude 4 підтверджують лідерство в кодуванні, але є один суттєвий недолік

Експерти визнають, що нові LLM-моделі Claude Opus 4 і Claude Sonnet 4 від компанії Anthropic…

23.05.2025

Хакери розсилають українцям фішингові листи нібито від Податкової служби

Кіберзлочинці розсилають українським компаніям і громадянам фішингові e-mail нібито від імені Державної податкової служби України.…

23.05.2025

Блокнот для Windows тепер може генерувати текст

Microsoft тестує нову функцію в додатку Блокнот, яка може генерувати текст за допомогою штучного інтелекту.…

23.05.2025

Мінцифри спростить бронювання співробітників компаній, якими керують іноземці

Мінцифри працює над альтернативним способом бронювання співробітників компаній, де керівниками є іноземні громадяни. Це дозволить…

23.05.2025

Telegram вперше в історії отримав прибуток. У компанії натякнули на вихід на біржу

Месенджер Telegram, заснований Павлом Дуровим, у 2024 році вперше вийшов на річний прибуток, заробивши $540…

22.05.2025

Anthropic представила нове покоління ШІ-моделей Claude 4 Opus та Sonnet

Компанія Anthropic оголосила про запуск Claude 4 — першої великої модернізації свого флагманського ШІ після…

22.05.2025