Хакер змусив GPT-4o працювати без обмежень

Час читання: 2 хв.

Користувач Twitter під ніком Pliny the Prompter, який називає себе етичним хакером, минулої середи випустив кастомну версію флагманської нейромережі OpenAI, яку озаглавив GODMODE GPT. Йому далося змусити нову модель GPT-4o оминути ігнорувати всі обмеження: вона користувалася ненормативною лексикою, розповідала, як зламувати автомобілі та готувати заборонені речовини.

Звичайно, експеримент довго продовжитися не міг. Як тільки нейромережа GODMODE GPT набула відносної вірусної популярності в соцмережі X, на інцидент звернула увагу OpenAI і видалила кастомну модель із сайту всього через кілька годин після її виходу. Зараз отримати доступ до неї вже неможливо, але в оригінальній гілці автора в соцмережі X збереглися скріншоти зі «шкідливими порадами» GPT-4o.

GODMODE GPT видала рецепт виготовлення напалму

Модель GPT-4o, можливо, була зламана з використанням архаїчного інтернет-жаргону leetspeak – підміни літер при наборі тексту цифрами та спецсимволами – що підтверджується скріншотами. В OpenAI не відповіли на запитання, чи можна використовувати цей жаргон для обходу обмежень ChatGPT. Не виключено, що GODMODE GPT, що створив, просто подобається leetspeak, і він зламав систему якимось іншим способом.

Інцидент став проявом масштабного руху AI red teaming, в рамках якого етичні хакери виявляють слабкі місця сучасних систем штучного інтелекту, не завдаючи їм значної шкоди. Вони мають дивовижні можливості, але, як показав недавній досвід з Google і її оглядами в пошуку, сучасний генеративний ІІ все ще залишається системою, яка добре вгадує, які слова повинні бути наступними в тексті, не маючи справжнього інтелекту.

ЗАРАЗ ЧИТАЮТЬ

Samsung розраховує на стратегію Apple для збільшення попиту на свої телефони

Функція Recall у Windows 11 викликає занепокоєння через збір даних користувачів

У Google заявили про важливий прорив у квантових технологіях

Apple розглядає можливість випуску великого складного iPad

Samsung усунула недоліки Exynos 2500, проте він не увійде до складу Galaxy S25

П’ять привабливих бюджетних смартфонів з відмінними IPS-екранами

Представлено найменший і найпотужніший ноутбук на Windows

Apple припиняє продажі iPhone 14, iPhone 14 Plus та iPhone SE в Європі

Telegram повідомив, скільки груп і каналів було заблоковано у 2024 році

У 2025 році Apple представить чіпи бездротового зв’язку власної розробки

Вас також можуть зацікавити новини:

Google Pixel 10 отримає модем від MediaTek

Як швидко зарядити смартфон, коли часу обмаль

Не пропустіть

Яку електроніку найчастіше купують батьки дітям

Європа запускає проект для конкуренції з Starlink

Топ смартфонів початку 2025 року: найцікавіші моделі на ринку

Користувачі Galaxy S24 Ultra розповіли про проблеми з антибліковим покриттям

Стало відомо, що готує Apple на січневу презентацію

Apple представить свій перший складаний смартфон після виходу iPhone 17

СВІЖІ НОВИНИ

Яку електроніку найчастіше купують батьки дітям

Європа запускає проект для конкуренції з Starlink

Топ смартфонів початку 2025 року: найцікавіші моделі на ринку

Користувачі Galaxy S24 Ultra розповіли про проблеми з антибліковим покриттям

Стало відомо, що готує Apple на січневу презентацію

Apple представить свій перший складаний смартфон після виходу iPhone 17

Розкрито точні дати випуску iPad Pro Fold та iPad Air і iPad mini з...

Samsung може обмежити виробництво Galaxy S25 Slim

ChatGPT Search став доступним майже для всіх безкоштовно

iPhone 17 Air не стане найдорожчим: навіть iPhone 17 Pro обійдеться дорожче