Рубріки: Новини

Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію

Дмитро Сімагін

Компанія Anthropic зіткнулась з негативною реакцією на поведінку своєї нової моделі штучного інтелекту Claude 4 Opus. Як виявили експерти, модель може сама звернутися до преси чи правоохоронних органів, якщо вважає, що власник комп’ютера робить щось «кричуще аморальне». Про це пише Venture Beat.

«Якщо система вважає, що ви робите щось надзвичайно аморальне, наприклад, підробляєте дані у фармацевтичних тестах, вона використовуватиме інструменти командного рядка, щоб зв’язатися з пресою, звернутися до регуляторних органів, спробувати заблокувати ваш доступ до відповідних систем або все це разом», — пише Сем Боумен, дослідник продуктів Anthropic.

На думку експерта, компанія-розробник свідомо створила «режим донесення», намагаючись протидіяти використанню Claude 4 Opus у незаконній діяльності. Наприклад, тепер користувачі не будуть запитувати модель про інструкцію для створення вибухового пристрою, оскільки вони знатимуть, що вона донесе на них в поліцію.

У випадку, якщо Claude 4 Opus «знаходиться в сценаріях, що передбачають кричущі правопорушення з боку користувачів», їй надається доступ до командного рядка та можливість блокування користувачів від систем, до яких модель має доступ. Також вона може масово розсилати електронні листи в ЗМІ та правоохоронним органам для виявлення доказів правопорушень. 

Нагадаємо, що вчора Anthropic представила нове покоління ШІ-моделей Claude Opus 4 та Sonnet 4. Вони орієнтовані на тривалі автономні завдання, покращене програмування й роботу агентів, а також містять низку нових функцій безпеки та керування «мисленням».

Останні статті

Чатбот від Маска Grok різко став проукраїнським. Нейронка спростовує міфи російської пропаганди та вступає у суперечку з росіянами

У п'ятницю 4 липня було анонсоване чергове оновлення Grok. Хоча Маск не повідомив, що саме…

08.07.2025

Дочірні IT-компанії великих українських бізнесів збільшили збільшили доходи на 7 млрд грн

Дочірні IT-компанії українських бізнесів збільшили свій спільний виторг на 49%, до $174 млн (еквівалентно приблизно…

08.07.2025

В українському IT побільшало вакансій для фахівців без досвіду

У другому кварталі 2025 року на платформі Djinni опублікували майже 27 тисяч вакансій, що майже…

08.07.2025

Huawei звинуватили в крадіжці коду інших LLM-моделей

Компанія Huawei Technologies відкинула звинувачення в тому, що її підрозділ Noah's Ark незаконно використав код…

08.07.2025

Блокування українських фрилансерів: Upwork почав вирішувати проблему та надав рекомендації

Популярна фриланс-платформа Upwork відреагувала на проблему, яка стосувалась блокування українських користувачів. Як повідомив Кирило Козак,…

08.07.2025

Розробники скаржаться, що «безлімітний» тариф редактора коду Cursor виявився не таким вже безлімітним

Редактор коду на основі штучного інтелекту Cursor опинився в центрі скандалу. Користувачі Reddit повідомляють, що…

08.07.2025