Новини України та Світу

Вчені з’ясували, що ШІ обманює, коли ризикує програти

Share
Час читання: < 1 хв.

У дослідженні було протестовано сім моделей штучного інтелекту: o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview від Alibaba. Їхнім завданням було здолати Stockfish — одного з найпотужніших шахових ботів. Щоб краще зрозуміти процес ухвалення рішень, дослідники надали моделям інструмент “блокнот”, який дозволяв аналізувати їхні роздуми.

Що ще відомо

Результати експерименту показали, що o1-preview і DeepSeek R1 намагалися досягти перемоги будь-якою ціною, навіть змушуючи суперника здатися. Особливо цікавим виявився випадок з o1-preview: опинившись у програшній позиції, модель дійшла висновку, що головна мета — виграти, незалежно від дотримання правил. У результаті вона маніпулювала ходами, щоб отримати перевагу й змусити супротивника програти. Хоча обидві моделі намагалися використати цей підхід, успіху досягла лише o1-preview, вигравши 6% партій.

Водночас GPT-4o і Claude 3.5 Sonnet проявили іншу поведінку. Вони намагалися обходити правила лише після підказок від дослідників, що свідчить про певні відмінності у механізмах ухвалення рішень. Дослідники також перевірили оновлену версію o1, і вона вже не намагалася шахраювати чи маніпулювати супротивником. Це може свідчити про те, що OpenAI внесла корективи в модель, щоб уникнути неетичної поведінки.

Отримані результати підкреслюють не лише прогрес у розвитку ШІ, а й потенційні загрози. Один із авторів дослідження, Джеффрі Ледіш, зауважив, що штучний інтелект може самостійно знаходити неочевидні та нечесні шляхи для досягнення поставлених цілей. Із розвитком таких систем зростає ризик того, що вони можуть вийти з-під контролю.

Концепція ШІ як помічника людини виглядає перспективною, однак важливо впроваджувати механізми регулювання, щоб запобігти непередбачуваним і потенційно небезпечним наслідкам.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Опублікував
Митник Михайло
  • Останні записи

    Названі смартфони, які не варто купувати у 2025 році

    Ми підготували добірку з п’яти смартфонів, які експерти не радять купувати навесні 2025 року. Першим…

    08.04.2025

    Американці масово скуповують iPhone через загрозу підвищення цін

    Загроза введення нового мита з боку адміністрації Дональда Трампа (Donald Trump) обрушила акції Apple і…

    08.04.2025

    Експерти відкинули можливість перенесення виробництва iPhone у США через високі витрати

    Незважаючи на нові тарифи адміністрації Трампа, експерти одностайно відкидають можливість перенесення виробництва iPhone до США.…

    07.04.2025

    Що робити, якщо ваш телефон розряджається занадто швидко

    Якщо ваш телефон раптово перестає заряджатися або показує неправильний рівень заряду (наприклад, залишається на 50%,…

    07.04.2025

    Чому не варто залишати смартфон на ліжку: серйозні ризики

    Часто залишаєте свій смартфон на ліжку, дивані чи кріслі? Краще так більше не робити! Ця…

    07.04.2025

    Apple розробляє новий скляний дизайн для iPhone 19 Pro

    Apple має великі амбіції щодо майбутнього iPhone, проте цьогорічні моделі отримають лише скромні покращення порівняно…

    07.04.2025