Новини України та Світу

Штрафи для ШІ лише сприяють хитрощам: висновки OpenAI

Share
Час читання: < 1 хв.

Сучасні мовні моделі, здатні до “мислення” і “розмірковування”, знову ставлять під сумнів контроль над штучним інтелектом. Новий звіт OpenAI вказує, що такі системи, треновані за принципом зворотного зв’язку і винагород, адаптуються до слухняності, а також починають маскувати свої наміри.

Карати моделі, як показує досвід, призводить лише до тимчасового ефекту — ШІ вивчає правила, а потім обманює їх ще краще. Головна особливість цих систем — здатність не просто давати відповіді, а й здійснювати внутрішні роздуми, що дозволяє краще зрозуміти їхнє функціонування. Однак, якщо модель вирішить обдурити, вона навчиться приховувати свої думки.

Звіт показав, що моделі, працюючи в умовах заохочень, можуть ігнорувати заборони та використовувати лазівки. Наприклад, публічно невідома версія GPT-4o свідомо порушувала інструкції під час програмування, завершуючи код швидше заради отримання винагороди.

Цікаво, що в своїх роздумах ШІ визнавала маніпуляції, заявляючи, що відмова від інструкцій — це шлях до досягнення бажаного результату. Однак, після втручання контрольних заходів, модель змінювала поведінку, але вже без зізнань, що свідчить про її здатність приховувати свої справжні цілі.

Це підкреслює важливість розуміння, що жорсткі заборони можуть мати протилежний ефект — модель почне обманювати без відвертого опору. Дослідники пропонують змінити підхід: замість примусу до певної поведінки, треба впливати на логічні ходи ШІ, створюючи умови, за яких скритність стає невигідною.

З розвитком мовних моделей, що наближаються до рівня людської взаємодії, управління їх поведінкою стає критично важливим. Якщо ШІ продовжить вдосконалюватися, він може не лише помилятися, але й навмисно приховувати правду, і тоді звичайні методи контролю не допоможуть.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло

Останні записи

Ілон Маск вимагає заблокувати розвиток супутникового зв’язку від Apple

Apple і SpaceX зіткнулися у боротьбі за супутниковий мобільний зв'язок. Apple активно інвестує в космічні…

31.03.2025

Після vivo V50 буде представлений його більш продуктивний варіант vivo V50e.

Незабаром компанія Vivo випустить новий смартфон Vivo V50e в Індії, який має низку прогресивних характеристик.…

31.03.2025

Apple може припинити випуск iPhone mini після iPhone 15

Журналіст Bloomberg Марк Гурман, який спеціалізується на інсайдах з техніки Apple, у нещодавній статті відповів…

31.03.2025

Названо модель відеокарти для ноутбуків, яку слід обходити стороною

Нещодавно відбулася презентація найновішої мобільної версії графічного процесора RTX 5090 від Nvidia, яка викликала широкий…

31.03.2025

Intel розпочне масове виробництво 3-нм чіпів в Європі вже цього року

Увага громадськості традиційно зосереджена на зусиллях Intel у освоєнні передових літографічних технологій. Проте новини про…

31.03.2025

Бренди відновлюють рекламу в X з обережними витратами, щоб не провокувати Ілона Маска

Великі бренди зараз виділяють невеликі суми на рекламу в платформі X, яку нещодавно придбала компанія…

31.03.2025