Новини України та Світу

Штучний інтелект виявився хитрішим, ніж вважали: вчені довели його здатність до обману

Share
Час читання: < 1 хв.

Вчені компанії Anthropic розробили методи, що дозволяють заглянути в механізми роботи великих мовних моделей ШІ та зрозуміти, як вони приймають рішення.

Раніше вважалося, що процес міркувань моделей повністю відстежити неможливо. Однак дослідження показало, що ШІ діє складніше, ніж припускали: при написанні текстів вибудовує плани, обробляє інформацію у зворотному напрямку та створює незалежні від мови абстрактні уявлення.

Нові методи, названі «трасуванням ланцюжків» та «графами атрибуції», допомогли виявити конкретні механізми роботи ШІ. Наприклад, модель Claude при написанні римованого двовірша спочатку підбирає слова, а потім формує речення. Також було доведено, що Claude вибудовує логічні ланцюжки. Наприклад, на запит «Столиця штату, в якому знаходиться Даллас…» спочатку активуються ознаки, що пов’язують Даллас із Техасом, а потім визначається Остін як відповідь.

Інше відкриття стосується мовної обробки: замість роботи з окремими мовами ШІ формує загальні абстрактні поняття, що дозволяє передавати знання між мовами.

Однак є і тривожні моменти. В деяких випадках Claude заявляв, що виконує складні обчислення, хоча насправді відповідав заздалегідь відомими результатами. Також модель може генерувати «галюцинації» — вигадані факти, якщо не має достовірної інформації, особливо щодо відомих особистостей.

Дослідження Anthropic є кроком до прозорості ШІ. Розуміння його логіки допоможе усунути помилки та підвищити надійність у комерційному використанні. Хоча створена лише попередня «карта» мислення ШІ, це важливий етап у вивченні його роботи.

Лужна Софія

Глибокі знання та досвід Софії у сфері технічної підтримки зробили її надійним помічником у вирішенні проблем, а пристрасть до технологій спонукала її ділитися своїми знаннями з іншими за допомогою свого контенту. Як людина, яка щодня працює над усуненням проблем і навчає своїх користувачів користуватися всіма доступними інструментами, маючи лише обліковий запис Google, її висвітлення новин, як правило, зосереджене на наданні читачам більш зручної для користувача точки зору та деяких менш відомих цікавинок на цю тему.

Опублікував
Лужна Софія

Останні записи

Apple продовжує вивчати ідею заміни фізичних кнопок iPhone на сенсорні

Згідно з останніми повідомленнями від інсайдерів, Apple продовжує працювати над сенсорними кнопками з тактильною віддачею…

03.04.2025

Новий флагман Sony Xperia 1 VII повністю розсекречено перед анонсом

Компанія Sony готується презентувати свій новий флагманський смартфон Xperia 1 VII у травні 2025 року.…

03.04.2025

Apple під загрозою: нові мита США можуть зруйнувати стратегію диверсифікації

Apple вже кілька років намагається знизити свою залежність від Китаю, переорієнтовуючи виробничі ланцюги на Індію,…

03.04.2025

Виявлено несподіваного претендента на купівлю TikTok

Компанія Amazon раптово висловила намір придбати TikTok, повідомляє MacRumors із посиланням на The New York…

03.04.2025

Топ-6 нестандартних способів використання USB-накопичувача

'Більшість людей використовують USB-накопичувачі для тимчасового зберігання файлів, але їх можливості значно ширші. Завдяки їм…

02.04.2025

Як штучний інтелект Apple може перевернути ваше уявлення про здоров’я

Apple стала однією з найбільш впливових компаній у світі, і її продукти, як iPhone, iPad…

02.04.2025