Вчені з’ясували, що ШІ обманює, коли ризикує програти

Час читання: < 1 хв.

У дослідженні було протестовано сім моделей штучного інтелекту: o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview від Alibaba. Їхнім завданням було здолати Stockfish — одного з найпотужніших шахових ботів. Щоб краще зрозуміти процес ухвалення рішень, дослідники надали моделям інструмент “блокнот”, який дозволяв аналізувати їхні роздуми.

Що ще відомо

Результати експерименту показали, що o1-preview і DeepSeek R1 намагалися досягти перемоги будь-якою ціною, навіть змушуючи суперника здатися. Особливо цікавим виявився випадок з o1-preview: опинившись у програшній позиції, модель дійшла висновку, що головна мета — виграти, незалежно від дотримання правил. У результаті вона маніпулювала ходами, щоб отримати перевагу й змусити супротивника програти. Хоча обидві моделі намагалися використати цей підхід, успіху досягла лише o1-preview, вигравши 6% партій.

Водночас GPT-4o і Claude 3.5 Sonnet проявили іншу поведінку. Вони намагалися обходити правила лише після підказок від дослідників, що свідчить про певні відмінності у механізмах ухвалення рішень. Дослідники також перевірили оновлену версію o1, і вона вже не намагалася шахраювати чи маніпулювати супротивником. Це може свідчити про те, що OpenAI внесла корективи в модель, щоб уникнути неетичної поведінки.

Отримані результати підкреслюють не лише прогрес у розвитку ШІ, а й потенційні загрози. Один із авторів дослідження, Джеффрі Ледіш, зауважив, що штучний інтелект може самостійно знаходити неочевидні та нечесні шляхи для досягнення поставлених цілей. Із розвитком таких систем зростає ризик того, що вони можуть вийти з-під контролю.

Концепція ШІ як помічника людини виглядає перспективною, однак важливо впроваджувати механізми регулювання, щоб запобігти непередбачуваним і потенційно небезпечним наслідкам.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Наступні DeepSeek почав розкривати важливі елементи свого ШІ »

Попередні « Apple планує інтегрувати Google Gemini в Apple Intelligence

Залишити коментар

Опублікував

Митник Михайло

Tags: Штучний інтелект

23.02.2025 09:52

Експерти відкинули можливість перенесення виробництва iPhone у США через високі витрати

Незважаючи на нові тарифи адміністрації Трампа, експерти одностайно відкидають можливість перенесення виробництва iPhone до США.… Read More

Компанія Microsoft розробляє власний ШІ, щоб стати менш залежною від OpenAI

Незважаючи на співпрацю з розробником ШІ-систем OpenAI та інвестиції в нього $13,75 млрд, компанія Microsoft… Read More

Як тарифи Трампа вплинуть на вартість виробництва iPhone 16 Pro

Згідно з новим звітом The Wall Street Journal, вартість компонентів iPhone 16 Pro з 256… Read More

Останні записи

Смартфони

Названі смартфони, які не варто купувати у 2025 році

Ми підготували добірку з п’яти смартфонів, які експерти не радять купувати навесні 2025 року. Першим…

08.04.2025

Смартфони

Американці масово скуповують iPhone через загрозу підвищення цін

Загроза введення нового мита з боку адміністрації Дональда Трампа (Donald Trump) обрушила акції Apple і…

08.04.2025

Новини України та Світу

Експерти відкинули можливість перенесення виробництва iPhone у США через високі витрати

Незважаючи на нові тарифи адміністрації Трампа, експерти одностайно відкидають можливість перенесення виробництва iPhone до США.…

07.04.2025

Смартфони

Що робити, якщо ваш телефон розряджається занадто швидко

Якщо ваш телефон раптово перестає заряджатися або показує неправильний рівень заряду (наприклад, залишається на 50%,…

07.04.2025

Смартфони

Чому не варто залишати смартфон на ліжку: серйозні ризики

Часто залишаєте свій смартфон на ліжку, дивані чи кріслі? Краще так більше не робити! Ця…

07.04.2025

Смартфони

Apple розробляє новий скляний дизайн для iPhone 19 Pro

Apple має великі амбіції щодо майбутнього iPhone, проте цьогорічні моделі отримають лише скромні покращення порівняно…

07.04.2025

Вчені з’ясували, що ШІ обманює, коли ризикує програти

Що ще відомо

Пов’язана публікація

Останні записи

Названі смартфони, які не варто купувати у 2025 році

Американці масово скуповують iPhone через загрозу підвищення цін

Експерти відкинули можливість перенесення виробництва iPhone у США через високі витрати

Що робити, якщо ваш телефон розряджається занадто швидко

Чому не варто залишати смартфон на ліжку: серйозні ризики

Apple розробляє новий скляний дизайн для iPhone 19 Pro