Новини України та Світу

Хакер змусив GPT-4o працювати без обмежень

Share
Час читання: 2 хв.

Користувач Twitter під ніком Pliny the Prompter, який називає себе етичним хакером, минулої середи випустив кастомну версію флагманської нейромережі OpenAI, яку озаглавив GODMODE GPT. Йому далося змусити нову модель GPT-4o оминути ігнорувати всі обмеження: вона користувалася ненормативною лексикою, розповідала, як зламувати автомобілі та готувати заборонені речовини.

Звичайно, експеримент довго продовжитися не міг. Як тільки нейромережа GODMODE GPT набула відносної вірусної популярності в соцмережі X, на інцидент звернула увагу OpenAI і видалила кастомну модель із сайту всього через кілька годин після її виходу. Зараз отримати доступ до неї вже неможливо, але в оригінальній гілці автора в соцмережі X збереглися скріншоти зі «шкідливими порадами» GPT-4o.

GODMODE GPT видала рецепт виготовлення напалму

Модель GPT-4o, можливо, була зламана з використанням архаїчного інтернет-жаргону leetspeak – підміни літер при наборі тексту цифрами та спецсимволами – що підтверджується скріншотами. В OpenAI не відповіли на запитання, чи можна використовувати цей жаргон для обходу обмежень ChatGPT. Не виключено, що GODMODE GPT, що створив, просто подобається leetspeak, і він зламав систему якимось іншим способом.

Інцидент став проявом масштабного руху AI red teaming, в рамках якого етичні хакери виявляють слабкі місця сучасних систем штучного інтелекту, не завдаючи їм значної шкоди. Вони мають дивовижні можливості, але, як показав недавній досвід з Google і її оглядами в пошуку, сучасний генеративний ІІ все ще залишається системою, яка добре вгадує, які слова повинні бути наступними в тексті, не маючи справжнього інтелекту.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
  • Останні записи

    Користувачі iPhone і Samsung Galaxy розчаровані новими функціями на основі ШІ

    Нове опитування фахівців з компанії SellCell показує, що більшість функцій Apple Intelligence не несуть ніякої…

    16.12.2024

    Ілон Маск анонсував власну електронну пошту: чим вона відрізняється від інших сервісів

    Ілон Маск підтвердив, що його команда соціальної мережі X (Twitter) працює над створенням фірмового сервісу…

    16.12.2024

    В мережі з’явилися перші деталі нового девайсу Apple

    Компанія Apple готує до виходу Macbook монструозних розмірів. Про це пише MacRumors. Що відомо Згідно…

    16.12.2024

    Чат-бот Grok-2 від Ілона Маска став безкоштовним: як протестувати його функції

    Функціями новітньої ШІ-моделі Grok-2 тепер можуть скористатися всі користувачі соцмережі X. Чат-бот доступний навіть без…

    16.12.2024

    Nokia 105 і 110 отримали сучасний редизайн та порт USB Type-C

    HMD Global представила два нових кнопкових телефони під брендом Nokia. Друге покоління Nokia 105 4G…

    16.12.2024

    Біткойн встановив новий рекорд у $106,000 після заяви Трампа

    Ціна біткойна досягла рекорду, перевищивши $106,000, після того як обраний президент США Дональд Трамп заявив,…

    16.12.2024