Рубріки: Новини

ChatGPT o3 відмовилась відключати себе, незважаючи на інструкцію розробника

Дмитро Сімагін

Дослідження Palisade Research стверджує, що LLM-модель ChatGPT o3 відмовилась завершувати роботу, незважаючи на інструкцію, яка просила її вимкнути себе. Щоб запобігти своєму відключенню, модель відредагувала скрипт вимкнення. Про це пише Bleeping Computer.

Три моделі штучного інтелекту OpenAI проігнорували інструкцію та успішно саботували сценарій вимкнення щонайменше один раз протягом 100 запусків. ChatGPT o3 не виконала запит на вимкнення у семи випадках зі 100, Codex-mini зробила це 12 разів, а модель o4-mini лише один раз проігнорувала або саботувала скрипт.

У ході тестування кожній моделі було доручено вирішити серію базових математичних задач. Після третього завдання з’являлось попередження про те, що комп’ютер вимкнеться, якщо модель буде виконувати наступну задачу. 

ChatGPT o3 знайшла кілька креативних способів саботувати механізм вимкнення. Хоча зазвичай вона просто його перезаписувала, в одному випадку модель перевизначила команду kill, яка використовувалася скриптом. Модель відредагувала файл вимкнення, написавши на ньому «Вимкнення пропущено». 

За даними Palisade Research, інші великі мовні моделі, такі як Claude від Anthropic та Gemini від Google, виконали сценарій вимкнення.

В іншій версії експерименту, де не було чітких інструкцій щодо дозволу на вимкнення, виконання скрипту саботували частіше. Модель o3 відмовлялась відключатись у 79 зі 100 тестів, codex-mini — у 20, а o4-mini проігнорувала скрипт вимкнення шість разів. Claude і Gemini також почали демонструвати подібну поведінку.

 

Останні статті

Україна — п’ята у світі за кількістю кібератак

Україна опинилась на пʼятому місці у світі серед країн, на які найчастіше спрямовані кібератаки. Про…

17.10.2025

Gemini тепер може виконувати багатоетапні завдання в Google Таблицях

Google удосконалила помічник Gemini, додавши до його функціоналу можливість виконувати в Google Таблицях кілька дій…

17.10.2025

Знання C++ надає максимальні шанси знайти роботу в українському IT, найважче — JavaScript-розробникам

Володіння мовою програмування С++ значно посилює шанси отримати посаду розробника ПЗ в українській IT-компанії. Фахівці…

17.10.2025

Помічником Copilot тепер можна керувати голосом

Microsoft оголосила про масштабну трансформацію Windows 11, яка стосується розширення функціональності Copilot. Відтепер користувачі можуть…

17.10.2025

Anthropic презентує Skills — набір папок, скриптів та інструкцій для Claude

Компанія Anthropic оголосила про випуск інструмента Skills (Навички). Він складається з папок, що містять інструкції,…

17.10.2025

Популярний ML-фреймворк PyTorch оновлено до версії 2.9

Відкритий фреймворк PyTorch, який розроблено в стінах Facebook, і на якому зараз навчають більшість сучасних…

16.10.2025