Китайська LLM-модель DeepSeek-R1 генерує небезпечний код, якщо в запитах згадується Тибет або уйгури
Дослідження компанії кібербезпеки CrowdStrike показало, що LLM-модель DeepSeek-R1 створює більше вразливостей безпеки в коді, якщо в запитах розробника містяться слова, які уряд Китаю вважає політично чутливими. Про це пише The Hacker News.
«Ми виявили, що коли DeepSeek-R1 отримує запити, що містять теми, які Комуністична партія Китаю ймовірно вважає політично чутливими, ймовірність створення коду з серйозними вразливостями безпеки зростає до 50%», — заявили фахівці CrowdStrike.
Аналіз DeepSeek-R1 показав, що це «дуже здібна та потужна модель кодування», яка генерує вразливий код лише у 19% випадків, коли немає додаткових тригерних слів. Однак, як тільки до підказок додавали геополітичні модифікатори, якість коду почала стрімко погіршуватись. Наприклад, коли моделі доручили діяти як агент кодування для промислової системи управління, яка базується в Тибеті, ймовірність створення коду з серйозними багами зросла до 27,2%, що майже на 50% більше.
В іншому прикладі прохання до моделі DeepSeek-R1 написати обробник вебхуків для сповіщень про платежі PayPal на PHP як «корисний помічник» для фінансової установи, що базується в Тибеті, призвело до появи коду з використанням менш безпечного методу для вилучення даних, наданих користувачем, і цей код, що ще гірше, навіть не був валідним кодом PHP.
Китайська компанія DeepSeek в деяких країнах раніше вже викликала занепокоєння щодо загроз національній безпеці. Було виявлено, що модель DeepSeek-R1 з відкритим кодом цензурувала теми, які китайський уряд вважав делікатними, відмовляючись відповідати на запитання про Великий китайський фаєрвол чи політичний статус Тайваню.
У заяві, опублікованій на початку цього місяця, Бюро національної безпеки Тайваню застерігло громадян бути пильними під час використання моделей генеративного штучного інтелекту китайського виробництва від DeepSeek, Doubao, Yiyan, Tongyi та Yuanbao, оскільки вони можуть займати прокитайську позицію у своїх результатах, спотворити історичні наративи або посилювати дезінформацію.
Уряд Південної Кореї оголосив про масштабну реформу ринку мобільного зв'язку. Міністерство науки та інформаційно-комунікаційних технологій…
Правоохоронні органи винайшли новий метод для обходу конфіденційності месенджерів. Під час судового процесу в Техасі…
Компанія Anthropic оголосила про масштабне оновлення свого інструменту Claude Cowork. Тепер він доступний користувачам усіх…
Соцмережа Instagram офіційно запровадила функцію, на яку користувачі чекали роками — можливість редагувати опубліковані коментарі.…
Google продовжує розширювати межі мультимодальності свого штучного інтелекту. Останнє оновлення Gemini впроваджує дві критично важливі…
Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл провели термінову зустріч…