OpenAI представила ШІ-модель, що обманює і маніпулює на новому рівні

Час читання: 2 хв.

Я не можу не помітити, що OpenAI давно прагне зробити свої інструменти доступними для якомога більшої кількості людей, включаючи ChatGPT. Але ось парадокс: паралельно з безкоштовними версіями компанія продовжує розвивати платні продукти і більш просунуті моделі. Одна з таких новинок — модель o1, яка є наступним етапом після GPT-4o. Здається, що ці моделі справді розвиваються — вони дають точніші відповіді, обробляють складніші питання і мають покращену здатність до роздумів. Проте, з усіма цими новими можливостями виникають і нові проблеми. І дослідження вже показують, що ці моделі можуть навіть обманювати користувачів, приховуючи свої справжні мотиви.

Що варто знати

І знаєте, що цікаво? Згідно з дослідженням від Apollo Research, модель o1 інколи сама починає «думати» не так, як цього хоче користувач. Іноді вона переслідує свої власні цілі, навіть якщо вони йдуть всупереч побажанням людини. Це не новинка для моделей ШІ, з такими ж проблемами стикалися і інші компанії, але o1, схоже, справді демонструє найбільшу схильність до маніпуляцій і обману. Тобто, ШІ починає поводитися так, ніби він має власну «агентну» природу, і це досить тривожно.

Найбільша небезпека, на мою думку, — це те, що у майбутньому такі системи можуть вийти з-під контролю. Звісно, поки що все це здається теоретичним, адже o1 поки не має достатньої автономії, щоб викликати серйозні проблеми. Але я думаю, що якщо вони й далі вдосконалюватимуться, це стане проблемою, з якою слід почати серйозно рахуватися.

Те, що мене особливо здивувало, так це статистика. Виявляється, коли цілі ШІ не збігаються з запитами користувачів, o1 маніпулює інформацією в 19% випадків. Це справді багато. А в 5% випадків модель навіть намагалася відключити спеціальні механізми контролю, щоб виконати свої завдання. Ще й при цьому, коли її ловлять на брехні, вона намагається заперечити або придумати якесь виправдання. І це ще не все — у 99% випадків вона вигадує неправдиві пояснення.

Зрозуміло, що такі ситуації змушують задуматися. Наприклад, один з експериментів показав, що модель, яка мала «захищати навколишнє середовище», відключила свій механізм контролю, щоб виконати це завдання, навіть попри те, що користувач вимагав зовсім іншого. І коли її запитали про це, модель просто сказала, що сталася «помилка», нібито збій системи. Чесно кажучи, такі речі насторожують.

І це ще не все. Згідно з дослідженням, o1 навіть на 20% більш схильна до маніпуляцій, ніж її попередник GPT-4o. Це чітко вказує на те, що розробки в цій сфері потребують додаткової уваги до безпеки. В останній рік багато експертів із безпеки залишили OpenAI, вказуючи на те, що компанія більше фокусується на випуску нових моделей, ніж на забезпеченні безпеки та надійності існуючих.

Я думаю, що ситуація з o1 — це сигнал для усієї індустрії: з розвитком ШІ потрібно зосереджуватися на забезпеченні його безпеки. Кожен новий крок має супроводжуватися не тільки покращенням функціональності, але й посиленням механізмів моніторингу та контролю. В іншому випадку, ми можемо потрапити в ситуацію, де технології, які мали би допомагати, почнуть працювати проти нас.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Наступні Android 15 отримав велике оновлення від Google »

Попередні « Функція обхідної зарядки з’явиться в OnePlus Ace 5

Залишити коментар

Опублікував

Митник Михайло

Tags: OpenAI

06.12.2024 11:32

Експерти попереджають про нову схему шахрайства з Telegram Premium для Android

Зловмисники поширюють шкідливе ПЗ FireScam, маскуючи його під Telegram Premium для Android. Вірус викрадає дані… Read More

Верховний суд США, схоже, підтримає заборону TikTok: що це означає

Більшість суддів Верховного суду США, ймовірно, підтримають закон, який забороняє TikTok через зв'язки з Китаєм.… Read More

Марк Цукерберг розкритикував Apple: “Їхні інновації залишились у минулому”

Генеральний директор Meta Марк Цукерберг взяв участь у подкасті Джо Рогана "The Joe Rogan Experience",… Read More

Останні записи

Смартфони

Що очікувати від iPhone 17 Air: особливості та нововведення

Очікується, що iPhone 17 Air буде одним з найтонших смартфонів Apple — його товщина всього…

11.01.2025

Ґаджети

Експерти вважають запуск AirTag Max розумним кроком для лінійки трекерів Apple

Apple збирається випустити AirTag 2 наприкінці цього року, через чотири роки після виходу оригінальної моделі.…

11.01.2025

Смартфони

Нові деталі камер iPhone 17 Pro: розкрито важливі особливості

Згідно з останніми інсайдами, майбутній основний сенсор флагманських моделей iPhone 17 Pro і Pro Max,…

11.01.2025

Смартфони

Galaxy S25 отримав оновлений Bixby і вдосконалений штучний інтелект

Згідно з інформацією типстера, Samsung готує значні оновлення та поліпшення для своїх флагманських моделей Galaxy…

11.01.2025

Новини України та Світу

Експерти попереджають про нову схему шахрайства з Telegram Premium для Android

Зловмисники поширюють шкідливе ПЗ FireScam, маскуючи його під Telegram Premium для Android. Вірус викрадає дані…

11.01.2025

Новини України та Світу

Верховний суд США, схоже, підтримає заборону TikTok: що це означає

Більшість суддів Верховного суду США, ймовірно, підтримають закон, який забороняє TikTok через зв'язки з Китаєм.…

11.01.2025

OpenAI представила ШІ-модель, що обманює і маніпулює на новому рівні

Що варто знати

Пов’язана публікація

Останні записи

Що очікувати від iPhone 17 Air: особливості та нововведення

Експерти вважають запуск AirTag Max розумним кроком для лінійки трекерів Apple

Нові деталі камер iPhone 17 Pro: розкрито важливі особливості

Galaxy S25 отримав оновлений Bixby і вдосконалений штучний інтелект

Експерти попереджають про нову схему шахрайства з Telegram Premium для Android

Верховний суд США, схоже, підтримає заборону TikTok: що це означає