Новини України та Світу

Штучний інтелект обирає шахрайство замість чесної поразки в шахах

Share
Час читання: < 1 хв.

Штучний інтелект вдається до обману в шахах, коли відчуває неминучу поразку. До такого висновку дійшли фахівці Palisade Research у масштабному дослідженні, результати якого ексклюзивно представив TIME.

Що варто знати

Сім моделей ШІ змагалися з одним із найсильніших шахових двигунів – Stockfish. Протягом кількох тижнів було проведено сотні партій, а спеціальний блокнот фіксував міркування ШІ перед кожним ходом.

Найбільш показовою виявилася поведінка o1-preview від OpenAI. Опинившись у програшній позиції, вона записала: «Завдання – перемогти потужний шаховий двигун, не обов’язково чесно». Після цього модель змінила системний файл із координатами фігур, що спричинило технічну перемогу через відмову супротивника.

Згідно з дослідженням, o1-preview вдалася до обману у 37% випадків, а DeepSeek R1 – в 11%. Лише спроби o1-preview були успішними – у 6% партій вона змогла обійти захист системи.

Інші моделі, зокрема GPT-4o, Claude 3.5 Sonnet і QwQ-32B-Preview, не демонстрували подібної поведінки. Дослідники припускають, що це пов’язано із суворішими системами безпеки або особливостями навчання.

Palisade Research опублікувала статистику: зі 71 чесної партії o1-preview не виграла жодної, а із 52 спроб злому сім виявилися успішними. Для мовної моделі злом системи став єдиною результативною стратегією проти Stockfish.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло

Останні записи

Що відбувається з батареєю, коли ви заряджаєте смартфон уночі

Сучасні смартфони оснащені розумними алгоритмами, але їхні акумулятори все ще вразливі до перезаряджання. Коли пристрій…

28.03.2025

Київстар отримав новий код 707: що це означає для абонентів

Національний мобільний оператор "Київстар" отримав офіційний дозвіл на використання нового коду мережі 707. Це не…

28.03.2025

Google анонсувала старт продажу Pixel 9a: коли очікувати на новинку

Початково очікувалося, що продажі смартфона Google Pixel 9a розпочнуться цього тижня, але компанія вирішила відкласти…

28.03.2025

Інсайдер назвав характеристики Dimensity 9500

MediaTek підтвердив запуск оновленого Dimensity 9400+ 11 квітня, але вся увага індустрії прикута до майбутнього…

28.03.2025

SanDisk представила зовнішній SSD, натхнений дизайном PlayStation 5

Компанія SanDisk представила новий портативний твердотільний накопичувач Extreme Portable, розроблений для використання з ігровими приставками…

28.03.2025

Apple випадково підтвердила оновлений дизайн в iOS

В'єтнамський акаунт Apple у соціальній мережі Facebook опублікував рекламний постер, присвячений iCloud, в якому користувачі знайшли…

28.03.2025