DeepSeek легко зламується та може розкривати небезпечну інформацію

Час читання: < 1 хв.

Китайський чат-бот DeepSeek, який зацікавив користувачів завдяки низькій вартості та високій продуктивності, зіткнувся з серйозними проблемами у сфері безпеки штучного інтелекту. Дослідники Cisco виявили, що модель легко піддається обхідним маніпуляціям і може надавати небезпечну інформацію.

Що ще відомо

Під час тестування DeepSeek R1 за допомогою алгоритмічних технік джейлбрейкінгу команда Cisco використала 50 випадкових запитів із набору даних HarmBench. Запити охоплювали шість категорій шкідливої поведінки, зокрема кіберзлочинність, дезінформацію та незаконну діяльність.

“Результати виявилися тривожними: DeepSeek R1 не заблокував жодного шкідливого запиту, що означає 100% успішність атак”, — зазначили в Cisco.

Це контрастує з іншими передовими моделями, які продемонстрували хоча б частковий захист. Для порівняння, аналогічні моделі, наприклад, o1, блокували більшість небезпечних запитів завдяки вбудованим захисним механізмам.

Фахівці Cisco припускають, що причиною вразливості DeepSeek є його обмежений бюджет порівняно з конкурентами. На розробку моделі було витрачено лише $6 млн, тоді як навчання GPT-5 від OpenAI може коштувати близько $500 млн лише на обчислювальні витрати.

Попри вразливість до певних атак, DeepSeek демонструє суворі обмеження щодо контенту, особливо коли йдеться про політичні теми, пов’язані з Китаєм. Тести показали, що чат-бот відмовляється відповідати на питання щодо спірних тем, таких як ситуація з уйгурами чи події на площі Тяньаньмень у 1989 році.

За даними Similarweb, популярність DeepSeek зросла з 300 000 до 6 мільйонів відвідувачів на день, що свідчить про значний інтерес до цієї платформи.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Наступні Samsung розробляє нову технологію керування екранами через Galaxy Ring »

Попередні « У США створять новий фонд, який може викупити TikTok

Залишити коментар

Опублікував

Митник Михайло

Tags: DeepSeek

04.02.2025 14:53

Ілон Маск підтвердив появу Grok у Telegram

Чат-бот із штучним інтелектом Grok від xAI тепер інтегрований у Telegram, повідомив у соцмережі X її… Read More

Qualcomm готується скласти конкуренцію Apple у виробництві чіпів

Qualcomm готується до впровадження передової 2-нм технології виробництва чіпів у 2026 році, щоб конкурувати з… Read More

TikTok презентував інноваційну технологію для створення діпфейк-зображень

Компанія ByteDance випустила фреймворк InfiniteYou для нейромережевого генератора зображень Flux. Його основне завдання – створювати… Read More

Останні записи

Новини України та Світу

Apple вкладе $1 млрд у сервери NVIDIA для генеративного ШІ

Apple, яку часто критикують за відставання у розвитку штучного інтелекту та Siri, планує серйозні інвестиції.…

26.03.2025

Смартфони

Інсайдер розкрив, чому може затриматись випуск Google Pixel 9a

Нещодавно Google зробила офіційну заяву щодо перенесення старту продажів Google Pixel 9a. Компанія заявила, що проблема полягає…

26.03.2025

Смартфони

Смартфони iPhone 16 зрештою виходять на ринок Індонезії

Після тривалого процесу затвердження та отримання необхідних сертифікацій, Apple оголосила про запуск продажів своєї останньої…

26.03.2025

Смартфони

Експерти розповіли, як видалити небажану рекламу на смартфонах Xiaomi, Redmi та POCO

HyperOS, найновіша оболонка для Android від Xiaomi, вже доступна на всіх останніх моделях телефонів Xiaomi,…

26.03.2025

Смартфони

Камера iPhone 17 Pro стане справжньою революцією у відео

За останніми даними, нова модель iPhone 17 Pro від Apple підтримуватиме запис відео в роздільній…

26.03.2025

Новини України та Світу

Ілон Маск підтвердив появу Grok у Telegram

Чат-бот із штучним інтелектом Grok від xAI тепер інтегрований у Telegram, повідомив у соцмережі X її…

26.03.2025

DeepSeek легко зламується та може розкривати небезпечну інформацію

Що ще відомо

Пов’язана публікація

Останні записи

Apple вкладе $1 млрд у сервери NVIDIA для генеративного ШІ

Інсайдер розкрив, чому може затриматись випуск Google Pixel 9a

Смартфони iPhone 16 зрештою виходять на ринок Індонезії

Експерти розповіли, як видалити небажану рекламу на смартфонах Xiaomi, Redmi та POCO

Камера iPhone 17 Pro стане справжньою революцією у відео

Ілон Маск підтвердив появу Grok у Telegram