Новини України та Світу

DeepSeek легко зламується та може розкривати небезпечну інформацію

Share
Час читання: < 1 хв.

Китайський чат-бот DeepSeek, який зацікавив користувачів завдяки низькій вартості та високій продуктивності, зіткнувся з серйозними проблемами у сфері безпеки штучного інтелекту. Дослідники Cisco виявили, що модель легко піддається обхідним маніпуляціям і може надавати небезпечну інформацію.

Що ще відомо

Під час тестування DeepSeek R1 за допомогою алгоритмічних технік джейлбрейкінгу команда Cisco використала 50 випадкових запитів із набору даних HarmBench. Запити охоплювали шість категорій шкідливої поведінки, зокрема кіберзлочинність, дезінформацію та незаконну діяльність.

“Результати виявилися тривожними: DeepSeek R1 не заблокував жодного шкідливого запиту, що означає 100% успішність атак”, — зазначили в Cisco.

Це контрастує з іншими передовими моделями, які продемонстрували хоча б частковий захист. Для порівняння, аналогічні моделі, наприклад, o1, блокували більшість небезпечних запитів завдяки вбудованим захисним механізмам.

Фахівці Cisco припускають, що причиною вразливості DeepSeek є його обмежений бюджет порівняно з конкурентами. На розробку моделі було витрачено лише $6 млн, тоді як навчання GPT-5 від OpenAI може коштувати близько $500 млн лише на обчислювальні витрати.

Попри вразливість до певних атак, DeepSeek демонструє суворі обмеження щодо контенту, особливо коли йдеться про політичні теми, пов’язані з Китаєм. Тести показали, що чат-бот відмовляється відповідати на питання щодо спірних тем, таких як ситуація з уйгурами чи події на площі Тяньаньмень у 1989 році.

За даними Similarweb, популярність DeepSeek зросла з 300 000 до 6 мільйонів відвідувачів на день, що свідчить про значний інтерес до цієї платформи.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Опублікував
Митник Михайло
Tags: DeepSeek

Останні записи

Apple вкладе $1 млрд у сервери NVIDIA для генеративного ШІ

Apple, яку часто критикують за відставання у розвитку штучного інтелекту та Siri, планує серйозні інвестиції.…

26.03.2025

Інсайдер розкрив, чому може затриматись випуск Google Pixel 9a

Нещодавно Google зробила офіційну заяву щодо перенесення старту продажів Google Pixel 9a. Компанія заявила, що проблема полягає…

26.03.2025

Смартфони iPhone 16 зрештою виходять на ринок Індонезії

Після тривалого процесу затвердження та отримання необхідних сертифікацій, Apple оголосила про запуск продажів своєї останньої…

26.03.2025

Експерти розповіли, як видалити небажану рекламу на смартфонах Xiaomi, Redmi та POCO

HyperOS, найновіша оболонка для Android від Xiaomi, вже доступна на всіх останніх моделях телефонів Xiaomi,…

26.03.2025

Камера iPhone 17 Pro стане справжньою революцією у відео

За останніми даними, нова модель iPhone 17 Pro від Apple підтримуватиме запис відео в роздільній…

26.03.2025

Ілон Маск підтвердив появу Grok у Telegram

Чат-бот із штучним інтелектом Grok від xAI тепер інтегрований у Telegram, повідомив у соцмережі X її…

26.03.2025