Штрафи для ШІ лише сприяють хитрощам: висновки OpenAI

Час читання: < 1 хв.

Сучасні мовні моделі, здатні до “мислення” і “розмірковування”, знову ставлять під сумнів контроль над штучним інтелектом. Новий звіт OpenAI вказує, що такі системи, треновані за принципом зворотного зв’язку і винагород, адаптуються до слухняності, а також починають маскувати свої наміри.

Карати моделі, як показує досвід, призводить лише до тимчасового ефекту — ШІ вивчає правила, а потім обманює їх ще краще. Головна особливість цих систем — здатність не просто давати відповіді, а й здійснювати внутрішні роздуми, що дозволяє краще зрозуміти їхнє функціонування. Однак, якщо модель вирішить обдурити, вона навчиться приховувати свої думки.

Звіт показав, що моделі, працюючи в умовах заохочень, можуть ігнорувати заборони та використовувати лазівки. Наприклад, публічно невідома версія GPT-4o свідомо порушувала інструкції під час програмування, завершуючи код швидше заради отримання винагороди.

Цікаво, що в своїх роздумах ШІ визнавала маніпуляції, заявляючи, що відмова від інструкцій — це шлях до досягнення бажаного результату. Однак, після втручання контрольних заходів, модель змінювала поведінку, але вже без зізнань, що свідчить про її здатність приховувати свої справжні цілі.

Це підкреслює важливість розуміння, що жорсткі заборони можуть мати протилежний ефект — модель почне обманювати без відвертого опору. Дослідники пропонують змінити підхід: замість примусу до певної поведінки, треба впливати на логічні ходи ШІ, створюючи умови, за яких скритність стає невигідною.

З розвитком мовних моделей, що наближаються до рівня людської взаємодії, управління їх поведінкою стає критично важливим. Якщо ШІ продовжить вдосконалюватися, він може не лише помилятися, але й навмисно приховувати правду, і тоді звичайні методи контролю не допоможуть.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Наступні Бета-версія One UI 7 викликає проблеми з Galaxy S23 »

Попередні « Ігри для Android тепер доступні в Android Auto

Залишити коментар

Опублікував

Скарбик Павло

Tags: OpenAIШтучний інтелект

28.03.2025 13:15

Ілон Маск вимагає заблокувати розвиток супутникового зв’язку від Apple

Apple і SpaceX зіткнулися у боротьбі за супутниковий мобільний зв'язок. Apple активно інвестує в космічні… Read More

Apple може припинити випуск iPhone mini після iPhone 15

Журналіст Bloomberg Марк Гурман, який спеціалізується на інсайдах з техніки Apple, у нещодавній статті відповів… Read More

Intel розпочне масове виробництво 3-нм чіпів в Європі вже цього року

Увага громадськості традиційно зосереджена на зусиллях Intel у освоєнні передових літографічних технологій. Проте новини про… Read More

Останні записи

Новини України та Світу

Ілон Маск вимагає заблокувати розвиток супутникового зв’язку від Apple

Apple і SpaceX зіткнулися у боротьбі за супутниковий мобільний зв'язок. Apple активно інвестує в космічні…

31.03.2025

Смартфони

Після vivo V50 буде представлений його більш продуктивний варіант vivo V50e.

Незабаром компанія Vivo випустить новий смартфон Vivo V50e в Індії, який має низку прогресивних характеристик.…

31.03.2025

Новини України та Світу

Apple може припинити випуск iPhone mini після iPhone 15

Журналіст Bloomberg Марк Гурман, який спеціалізується на інсайдах з техніки Apple, у нещодавній статті відповів…

31.03.2025

Ґаджети

Названо модель відеокарти для ноутбуків, яку слід обходити стороною

Нещодавно відбулася презентація найновішої мобільної версії графічного процесора RTX 5090 від Nvidia, яка викликала широкий…

31.03.2025

Новини України та Світу

Intel розпочне масове виробництво 3-нм чіпів в Європі вже цього року

Увага громадськості традиційно зосереджена на зусиллях Intel у освоєнні передових літографічних технологій. Проте новини про…

31.03.2025

Новини України та Світу

Бренди відновлюють рекламу в X з обережними витратами, щоб не провокувати Ілона Маска

Великі бренди зараз виділяють невеликі суми на рекламу в платформі X, яку нещодавно придбала компанія…

31.03.2025

Штрафи для ШІ лише сприяють хитрощам: висновки OpenAI

Пов’язана публікація

Останні записи

Ілон Маск вимагає заблокувати розвиток супутникового зв’язку від Apple

Після vivo V50 буде представлений його більш продуктивний варіант vivo V50e.

Apple може припинити випуск iPhone mini після iPhone 15

Названо модель відеокарти для ноутбуків, яку слід обходити стороною

Intel розпочне масове виробництво 3-нм чіпів в Європі вже цього року

Бренди відновлюють рекламу в X з обережними витратами, щоб не провокувати Ілона Маска