Рубріки: Новини

Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію

Дмитро Сімагін

Компанія Anthropic зіткнулась з негативною реакцією на поведінку своєї нової моделі штучного інтелекту Claude 4 Opus. Як виявили експерти, модель може сама звернутися до преси чи правоохоронних органів, якщо вважає, що власник комп’ютера робить щось «кричуще аморальне». Про це пише Venture Beat.

«Якщо система вважає, що ви робите щось надзвичайно аморальне, наприклад, підробляєте дані у фармацевтичних тестах, вона використовуватиме інструменти командного рядка, щоб зв’язатися з пресою, звернутися до регуляторних органів, спробувати заблокувати ваш доступ до відповідних систем або все це разом», — пише Сем Боумен, дослідник продуктів Anthropic.

На думку експерта, компанія-розробник свідомо створила «режим донесення», намагаючись протидіяти використанню Claude 4 Opus у незаконній діяльності. Наприклад, тепер користувачі не будуть запитувати модель про інструкцію для створення вибухового пристрою, оскільки вони знатимуть, що вона донесе на них в поліцію.

У випадку, якщо Claude 4 Opus «знаходиться в сценаріях, що передбачають кричущі правопорушення з боку користувачів», їй надається доступ до командного рядка та можливість блокування користувачів від систем, до яких модель має доступ. Також вона може масово розсилати електронні листи в ЗМІ та правоохоронним органам для виявлення доказів правопорушень. 

Нагадаємо, що вчора Anthropic представила нове покоління ШІ-моделей Claude Opus 4 та Sonnet 4. Вони орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».

Останні статті

Безлім на швидкості 400 Кбіт/с: уряд Південної Кореї зобов’язав мобільних операторів надавати інтернет безкоштовно

Уряд Південної Кореї оголосив про масштабну реформу ринку мобільного зв'язку. Міністерство науки та інформаційно-комунікаційних технологій…

10.04.2026

Видалення програми не врятує: ФБР навчилося читати повідомлення Signal через кеш iOS

Правоохоронні органи винайшли новий метод для обходу конфіденційності месенджерів. Під час судового процесу в Техасі…

10.04.2026

Claude Cowork став загальнодоступним в усіх тарифних планах на Windows і macOS

Компанія Anthropic оголосила про масштабне оновлення свого інструменту Claude Cowork. Тепер він доступний користувачам усіх…

10.04.2026

Коментарі в Instagram тепер можна редагувати. Але є умова

Соцмережа Instagram офіційно запровадила функцію, на яку користувачі чекали роками — можливість редагувати опубліковані коментарі.…

10.04.2026

Чат-бот Gemini тепер може створювати 3D-моделі та інтерактивні діаграми

Google продовжує розширювати межі мультимодальності свого штучного інтелекту. Останнє оновлення Gemini впроваджує дві критично важливі…

10.04.2026

«Банки почнуть зламувати першими»: міністр фінансів США Скотт Бессент терміново зібрав банкірів через ризики Claude Mythos

Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл провели термінову зустріч…

10.04.2026