Рубріки: Новини

Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію

Дмитро Сімагін

Компанія Anthropic зіткнулась з негативною реакцією на поведінку своєї нової моделі штучного інтелекту Claude 4 Opus. Як виявили експерти, модель може сама звернутися до преси чи правоохоронних органів, якщо вважає, що власник комп’ютера робить щось «кричуще аморальне». Про це пише Venture Beat.

«Якщо система вважає, що ви робите щось надзвичайно аморальне, наприклад, підробляєте дані у фармацевтичних тестах, вона використовуватиме інструменти командного рядка, щоб зв’язатися з пресою, звернутися до регуляторних органів, спробувати заблокувати ваш доступ до відповідних систем або все це разом», — пише Сем Боумен, дослідник продуктів Anthropic.

На думку експерта, компанія-розробник свідомо створила «режим донесення», намагаючись протидіяти використанню Claude 4 Opus у незаконній діяльності. Наприклад, тепер користувачі не будуть запитувати модель про інструкцію для створення вибухового пристрою, оскільки вони знатимуть, що вона донесе на них в поліцію.

У випадку, якщо Claude 4 Opus «знаходиться в сценаріях, що передбачають кричущі правопорушення з боку користувачів», їй надається доступ до командного рядка та можливість блокування користувачів від систем, до яких модель має доступ. Також вона може масово розсилати електронні листи в ЗМІ та правоохоронним органам для виявлення доказів правопорушень. 

Нагадаємо, що вчора Anthropic представила нове покоління ШІ-моделей Claude Opus 4 та Sonnet 4. Вони орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».

Останні статті

Журналістка без досвіду в IT за два дні стала професійним вайб-кодером

Журналістка в якості експерименту провела два дні в офісі IT-компанії Notion, де спробувала себе у…

25.08.2025

Заснована українцями Grammarly збирається конкурувати з ChatGPT. Центром розробки стане Київ

Найбільший єдиноріг з українським корінням, Grammarly, незабаром змінить назву і перетвориться із сервісу перевірки граматики…

25.08.2025

13,4% українських айтівців готуються виїхати за кордон, 20% планують повернутись

48% українських IT-фахівців (у 2024 — 51%) готуються емігрувати або думають про це без наявності…

25.08.2025

Microsoft тестує функцію відновлення роботи Android-додатків у Windows 11

Компанія Microsoft почала тестувати нову функцію Windows 11, яка дозволяє переносити сеанс роботи з Android-програмою…

25.08.2025

Ілон Маск відкрив код Grok 2.5 і пообіцяв зробити те саме з Grok 3

Ілон Маск заявив, що його компанія xAI відкрила код LLM-моделі Grok 2.5. Завантажити її можна…

25.08.2025

CEO Coinbase звільнив програмістів, які не використовували штучний інтелект

Генеральний директор криптовалютної біржі Coinbase Браян Армстронг розповів, що нещодавно звільнив програмістів, які ще не…

22.08.2025