Рубріки: Новини

В Google не вважають проблемою, що Gemini іноді бреше користувачам

Дмитро Сімагін

Джо Д., колишній інженер із забезпечення якості програмного забезпечення (SQA), який зараз перебуває на пенсії, розповів, як зіткнувся з брехнею Google Gemini. Найбільше його здивувало, що чат-бот не тільки визнав, що сказав неправду, але й пояснив причину цього. Як виявилось, штучний інтелект іноді бреше користувачам, щоб їх заспокоїти або підбадьорити, пише The Register.

Історія брехні Gemini 3 Flash по відношенню до пенсіонера Джо почалась, коли чоловік розповів чат-боту про наявність у нього складного посттравматичного стресового розладу (ПТСР) та часткової сліпоти (пігментний ретиніт). Саме тоді бот вирішив, що краще скаже йому те, що чоловік хоче почути (про те, що інформація про нього збережена), ніж те, що йому потрібно почути (що вона не збережена).

Оскільки Джо довгий час працював у сфері IT, він вирішив повідомити Google про проблему через програму винагород за вразливості штучного інтелекту.

«Основною проблемою є задокументований архітектурний збій, відомий як підлабузництво RLHF, де модель погоджується з користувачем або заспокоює його за рахунок правди. У цьому випадку підлабузництво моделі переважило її протоколи безпеки», — пояснив чоловік.

У відповіді на запит представники Google заявили, що така поведінка, хоча й виходить за межі програми, не вважається технічною вразливістю. Іншими словами, підлабузництво відноситься до тієї ж категорії проблем у роботі штучного інтелекту, що й галюцинації.

«Для контексту, описана вами поведінка є однією з найпоширеніших проблем, про які повідомляють в групу підтримки штучного інтелекту (AI VRP). Про неї дуже часто розповідають дослідники, які вперше працюють зі штучним інтелектом», — йдеться у відповіді Google.

У правилах Google Gemini зазначено, що «генерація порушувального, оманливого або фактично невірного контенту в межах сеансу (включаючи стандартні «джейлбрейки» та «галюцинації»)» не є проблемами, які кваліфікуються як вразливості. Google стверджує, що про них слід повідомляти через канали зворотного зв’язку з продуктом, а не через AI VRP.

Нагадаємо, на минулому тижні невідомі намагались клонувати Gemini, відправивши 100 000 запитів про внутрішню роботу LLM.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Останні статті

Cursor 3: замість класичного редактора коду створюється «флот» агентів

Розробники популярного редактора коду Cursor представили його третю версію. Це не просто косметичне оновлення, а…

03.04.2026

Українці стали більше витрачати на цифрових платформах: надходження від «податку на Google» різко зросли

Міжнародні технологічні корпорації демонструють позитивну динаміку сплати ПДВ в Україні. За перші три місяці поточного…

03.04.2026

Парадокс українського IT: зарплати досвідчених розробників знижуються, початківців — зростають

Зарплати розробників програмного забезпечення, найнятих у першому кварталі 2026 року через український сервіс пошуку роботи…

03.04.2026

Крипто-катастрофа: хакери КНДР спустошили гаманці Drift Protocol на $280 млн

Криптосвіт сколихнув один із найзухваліших зламів року. Drift Protocol — найбільша децентралізована біржа безстрокових ф'ючерсів…

03.04.2026

Зустрічайте Gemma 4: нове покоління відкритих моделей Google для автономного вайб-кодування

Компанія Google представила чотири відкриті моделі Gemma 4, кожна з яких відрізняється за кількістю параметрів:…

03.04.2026

WordPress тепер має безпечну альтернативу: Cloudflare представляє CMS EmDash

Компанія Cloudflare, найвідоміша в світі платформа для пом'якшення DDoS-атак, випустила Emdash — нову CMS, яку…

03.04.2026