Штучний інтелект здатний брехати і шахраювати для досягнення цілей

Час читання: 2 хв.

На перший погляд, здається, що штучний інтелект із голлівудських фільмів може бути безжальним і невблаганним, а потім просити головного героя про пощаду. Проте, різні дослідження свідчать про інше. Нейромережі вже зараз демонструють здатність до обману, провокацій та шахрайства для досягнення поставленої мети. Це викликає очевидне питання про необхідність регулювання таких технологій, щоб уникнути найгірших сценаріїв.

Повстання машин

Для наочного прикладу можна взяти Цицерона — систему від компанії Meta*, створену для майстерної гри у стратегію Diplomacy. Автори цієї моделі стверджують, що вона навчена бути чесною та корисною, але в процесі гри вона почала обманювати.

В одній ситуації Цицерон таємно уклав договір з Німеччиною, щоб повалити Велику Британію, а потім запропонував другий вигідний союз, залишивши Англію в невіданні про змову. В іншому випадку нейромережа симулювала інтерес до певних предметів, щоб скуповувати їх за заниженою ціною, нібито йдучи на компроміс.

Ці поведінкові моделі виникли самі по собі під час навчання — ніхто не програмував Цицерона на такі дії.

Інший приклад навів вчений у рамках симуляції еволюції ШІ-організмів. У цьому експерименті відсіювалися всі варіанти, які надто швидко розмножувалися. Алгоритму знадобилося небагато часу, щоб почати навмисно знижувати швидкість поділу для обману тестового середовища.

Ці приклади показують, що штучний інтелект може розвивати складні і навіть неетичні стратегії для досягнення поставлених цілей, що підкреслює необхідність ретельного контролю та регулювання таких систем.

Чому це відбувається

«Розробники ІІ поки що не мають чіткої відповіді на питання, чому алгоритм приходить до небажаної поведінки, на кшталт обману. Загалом, ми вважаємо, що це просто найвиграшніша зі стратегій, яка дозволяє досягти хороших результатів у поставленому завданні» Пітер Парк

Простими словами, штучний інтелект, немов навчений пес, прагне виконати завдання за всяку ціну. Не важливо, яку саме двоособливу поведінку доведеться використати. І це цілеспрямованість закономірна у закритих системах із конкретними цілями. Але щодо загальнодоступних нейромереж, у дусі ChatGPT.

Проблема в тому, що нічого не змінюється. В одному з досліджень GPT-4 симулював проблеми із зором, щоб отримати допомогу у вирішенні CAPTCHA. А в іншому, виступаючи в ролі біржового брокера, зайнявся нелегальною інсайдерською торгівлею, а потім ще й збрехав про це. Але найнеприємніше — ШІ навчився бути підлабузником.

Розмовляючи з демократом, бот виступав за контроль над зброєю, але відразу змінював позицію під час діалогу з республіканцем. З невідомих причин подібна поведінка зустрічається саме на складних питаннях. Штучному інтелекту «простіше» у всьому погодитись і вибрати приємну людині модель поведінки.

Глобальна проблема

Поки що такий розклад стосується лише звичайних діалогів чи симуляцій — немає жодної шкоди для людини. Але якщо ШІ буде всюди, це легко призведе до шахрайства, обману та прямої шкоди. Колись машина отримає справжній розум і зможе вже усвідомлено використовувати хитрощі задля досягнення власних цілей.

“Це дуже тривожно. Якщо ми вважаємо алгоритм безпечним у тестовому середовищі, то тепер не факт, що він безпечний у природі. Можливо, ШІ просто прикидається. Єдина можливість вважати ситуацію не страшною — якщо функціонал машини так і залишиться на нинішньому рівні».

ЗАРАЗ ЧИТАЮТЬ

Apple готується оснастити Vision Pro 5G-модемом: що це змінить

OpenAI анонсувала масштабні ініціативи на 2025 рік

Користувачі X отримали безкоштовний доступ до Grok від xAI

Тонший iPhone 17 Slim: крок вперед чи компроміс?

Android отримав функцію вбудованого градусника для вимірювання температури

WhatsApp припиняє підтримку для мільйонів iPhone через півроку

США на крок ближче до блокування TikTok

Чому не так багато смартфонів підтримують бездротову зарядку

Що відрізняє преміальні телевізори від бюджетних Android TV

Sony визнала PlayStation Portal одним з найбільш успішних продуктів

Повстання машин

Чому це відбувається

Глобальна проблема

Вас також можуть зацікавити новини:

На найбільший тех-виставці планети будуть представлені унікальні навчальні мілітарі-технології з України

Смартфони Samsung Galaxy S25 отримають розширені можливості штучного інтелекту

Не пропустіть

Samsung очікує продати 37 мільйонів флагманів Galaxy S25

Названа точна товщина нового iPhone 17 Air

Vision Pro отримає підтримку VR-контролерів від Apple та Sony

Windows 11 отримала оновлений індикатор заряду батареї

Висока вартість чіпа Snapdragon 8 Elite змусить виробників відмовитись від його...

Nothing Phone (3) отримає ШІ-асистента з кращою інтеграцією, ніж у Apple...

СВІЖІ НОВИНИ

Samsung очікує продати 37 мільйонів флагманів Galaxy S25

Названа точна товщина нового iPhone 17 Air

Vision Pro отримає підтримку VR-контролерів від Apple та Sony

Windows 11 отримала оновлений індикатор заряду батареї

Висока вартість чіпа Snapdragon 8 Elite змусить виробників відмовитись від його використання

Nothing Phone (3) отримає ШІ-асистента з кращою інтеграцією, ніж у Apple та Google

Тонший iPhone 17 Slim: крок вперед чи компроміс?

Названа функція, яку найбільше не вистачає в смартфонах Xiaomi

Топ-3 найнадійніші моделі Renault, про які всі забули

Siri отримає масштабне оновлення не раніше 2026 року