Хакер змусив GPT-4o працювати без обмежень

Час читання: 2 хв.

Користувач Twitter під ніком Pliny the Prompter, який називає себе етичним хакером, минулої середи випустив кастомну версію флагманської нейромережі OpenAI, яку озаглавив GODMODE GPT. Йому далося змусити нову модель GPT-4o оминути ігнорувати всі обмеження: вона користувалася ненормативною лексикою, розповідала, як зламувати автомобілі та готувати заборонені речовини.

Звичайно, експеримент довго продовжитися не міг. Як тільки нейромережа GODMODE GPT набула відносної вірусної популярності в соцмережі X, на інцидент звернула увагу OpenAI і видалила кастомну модель із сайту всього через кілька годин після її виходу. Зараз отримати доступ до неї вже неможливо, але в оригінальній гілці автора в соцмережі X збереглися скріншоти зі «шкідливими порадами» GPT-4o.

GODMODE GPT видала рецепт виготовлення напалму

Модель GPT-4o, можливо, була зламана з використанням архаїчного інтернет-жаргону leetspeak – підміни літер при наборі тексту цифрами та спецсимволами – що підтверджується скріншотами. В OpenAI не відповіли на запитання, чи можна використовувати цей жаргон для обходу обмежень ChatGPT. Не виключено, що GODMODE GPT, що створив, просто подобається leetspeak, і він зламав систему якимось іншим способом.

Інцидент став проявом масштабного руху AI red teaming, в рамках якого етичні хакери виявляють слабкі місця сучасних систем штучного інтелекту, не завдаючи їм значної шкоди. Вони мають дивовижні можливості, але, як показав недавній досвід з Google і її оглядами в пошуку, сучасний генеративний ІІ все ще залишається системою, яка добре вгадує, які слова повинні бути наступними в тексті, не маючи справжнього інтелекту.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Наступні Starlink хоче відкрити для користувачів супутниковий стільниковий зв'язок вже восени »

Попередні « Чим відрізняється Wi-Fi роутер від точки доступу

Залишити коментар

Опублікував

Скарбик Павло

Tags: ChatGPTGPT-4o

01.06.2024 14:41

В мережі з’явилися перші деталі нового девайсу Apple

Компанія Apple готує до виходу Macbook монструозних розмірів. Про це пише MacRumors. Що відомо Згідно… Read More

Ілон Маск анонсував власну електронну пошту: чим вона відрізняється від інших сервісів

Ілон Маск підтвердив, що його команда соціальної мережі X (Twitter) працює над створенням фірмового сервісу… Read More

Чат-бот Grok-2 від Ілона Маска став безкоштовним: як протестувати його функції

Функціями новітньої ШІ-моделі Grok-2 тепер можуть скористатися всі користувачі соцмережі X. Чат-бот доступний навіть без… Read More

Останні записи

Смартфони

Користувачі iPhone і Samsung Galaxy розчаровані новими функціями на основі ШІ

Нове опитування фахівців з компанії SellCell показує, що більшість функцій Apple Intelligence не несуть ніякої…

16.12.2024

Новини України та Світу

Ілон Маск анонсував власну електронну пошту: чим вона відрізняється від інших сервісів

Ілон Маск підтвердив, що його команда соціальної мережі X (Twitter) працює над створенням фірмового сервісу…

16.12.2024

Новини України та Світу

В мережі з’явилися перші деталі нового девайсу Apple

Компанія Apple готує до виходу Macbook монструозних розмірів. Про це пише MacRumors. Що відомо Згідно…

16.12.2024

Новини України та Світу

Чат-бот Grok-2 від Ілона Маска став безкоштовним: як протестувати його функції

Функціями новітньої ШІ-моделі Grok-2 тепер можуть скористатися всі користувачі соцмережі X. Чат-бот доступний навіть без…

16.12.2024

Смартфони

Nokia 105 і 110 отримали сучасний редизайн та порт USB Type-C

HMD Global представила два нових кнопкових телефони під брендом Nokia. Друге покоління Nokia 105 4G…

16.12.2024

Новини України та Світу

Біткойн встановив новий рекорд у $106,000 після заяви Трампа

Ціна біткойна досягла рекорду, перевищивши $106,000, після того як обраний президент США Дональд Трамп заявив,…

16.12.2024

Хакер змусив GPT-4o працювати без обмежень

Пов’язана публікація

Останні записи

Користувачі iPhone і Samsung Galaxy розчаровані новими функціями на основі ШІ

Ілон Маск анонсував власну електронну пошту: чим вона відрізняється від інших сервісів

В мережі з’явилися перші деталі нового девайсу Apple

Чат-бот Grok-2 від Ілона Маска став безкоштовним: як протестувати його функції

Nokia 105 і 110 отримали сучасний редизайн та порт USB Type-C

Біткойн встановив новий рекорд у $106,000 після заяви Трампа