Новини України та Світу

Хакер змусив GPT-4o працювати без обмежень

Share
Час читання: 2 хв.

Користувач Twitter під ніком Pliny the Prompter, який називає себе етичним хакером, минулої середи випустив кастомну версію флагманської нейромережі OpenAI, яку озаглавив GODMODE GPT. Йому далося змусити нову модель GPT-4o оминути ігнорувати всі обмеження: вона користувалася ненормативною лексикою, розповідала, як зламувати автомобілі та готувати заборонені речовини.

Звичайно, експеримент довго продовжитися не міг. Як тільки нейромережа GODMODE GPT набула відносної вірусної популярності в соцмережі X, на інцидент звернула увагу OpenAI і видалила кастомну модель із сайту всього через кілька годин після її виходу. Зараз отримати доступ до неї вже неможливо, але в оригінальній гілці автора в соцмережі X збереглися скріншоти зі «шкідливими порадами» GPT-4o.

GODMODE GPT видала рецепт виготовлення напалму

Модель GPT-4o, можливо, була зламана з використанням архаїчного інтернет-жаргону leetspeak – підміни літер при наборі тексту цифрами та спецсимволами – що підтверджується скріншотами. В OpenAI не відповіли на запитання, чи можна використовувати цей жаргон для обходу обмежень ChatGPT. Не виключено, що GODMODE GPT, що створив, просто подобається leetspeak, і він зламав систему якимось іншим способом.

Інцидент став проявом масштабного руху AI red teaming, в рамках якого етичні хакери виявляють слабкі місця сучасних систем штучного інтелекту, не завдаючи їм значної шкоди. Вони мають дивовижні можливості, але, як показав недавній досвід з Google і її оглядами в пошуку, сучасний генеративний ІІ все ще залишається системою, яка добре вгадує, які слова повинні бути наступними в тексті, не маючи справжнього інтелекту.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
  • Останні записи

    Nintendo Switch 2 вийде навесні 2025 року з магнітними джойконами і новим дизайном стіків

    У недавньому випуску іспанського подкасту Vandal Radio було розкрито нові подробиці про майбутню консоль Nintendo…

    28.09.2024

    Смарт-телевізори Samsung та LG роблять приховані скріншоти

    Популярні моделі смарт-телевізорів Samsung та LG таємно роблять скріншоти екрану, навіть коли користувач використовує їх…

    28.09.2024

    OpenAI планує збільшити вартість підписки на ChatGPT до $44

    OpenAI готується залучити $7 мільярдів у новому раунді фінансування, що може підвищити її оцінку до…

    28.09.2024

    Годинник Xiaomi Watch 2 випустили в новому кольорі

    На міжнародному ринку з'явилася нова версія розумного годинника Xiaomi Watch 2 у стильному кольорі Titan…

    28.09.2024

    VIVO випередила Samsung і Google у випуску Android 15 для флагманів

    Чудова новина для власників флагманських смартфонів VIVO – компанія першою серед великих брендів надала стабільні…

    28.09.2024

    Apple відмовляється від інвестицій в OpenAI

    Apple відмовилася від планів інвестувати в OpenAI, одного з провідних гравців у сфері штучного інтелекту,…

    28.09.2024