У смартфонах Samsung є функція Bixby Text Call, яка дозволяє відповідати на голосові дзвінки, не вимовляючи жодного звуку. Ідея в тому, що при неможливості або небажанні відповісти вголос, користувач зможе надрукувати відповідь, і він буде озвучений дзвонить. Раніше нею могли користуватися корейські користувачі, а тепер вона стала доступною і англійською. Крім того, планується навчити смартфони озвучувати повідомлення голосом користувача.
В даний час озвучення тексту голосом користувача доступне тільки корейською мовою в додатку Bixby Custom Voice Creator для невеликої кількості смартфонів Samsung – тільки нових флагманів Galaxy S23, S23+ та S23 Ultra. Якість голосу може бути жахливою, а час відгуку занадто великий, щоб ця функція виявилася реально корисною. Але саме по собі клонування голосів для відповіді на виклики цілком під силу сучасним технологіям, оскільки інструменти штучного інтелекту здатні створювати реалістичні копії голосів лише за кілька хвилин аудіозапису.
Сама собою відповідь на аудіодзвінки через текстовий інтерфейс вбудованим синтезованим голосом вже не новинка. На пристроях Samsung ця функція відома як Bixby Text Call, вона була представлена в оболонці One UI 5 для Android. Google пропонує аналогічну послугу під назвою Call Screen, яка дозволяє відповідати на потенційні спам-дзвінки за допомогою автоматизованого голосу. Але служба Google дозволяє вибирати лише зі списку спільних відповідей, а не вводити власні відповіді.
Неважко уявити, що найближчим часом ці функції стануть складнішими і автоматизованими. Зрештою, достатньо буде підключити свій голосовий клон, який перетворює текст на мову, до чат-боту на базі ІІ. Сама Samsung обіцяє, що в майбутньому згенеровані користувачами голоси будуть “сумісні з іншими програмами Samsung, крім телефонних дзвінків”, хоча неясно, що це означає.
Технологічні компанії давно обіцяють, що помічники на базі ІІ зможуть виконувати різного роду адміністрування від імені користувача, створення голосового клону самого себе і постановка йому завдань через чат-бота може фактично втілити цю ідею в життя.
Це також може створити всілякі проблеми. Google вже намагалася впроваджувати аналогічну функціональність у 2018 році за допомогою своєї технології Duplex AI як спосіб автоматичного бронювання столиків у ресторанах за допомогою голосу ІІ. Але реакція на цю технологію була неоднозначною: багато хто критикував її як неетичну і відзначав, що вона створює більше роботи для людей, які приймають дзвінки. Зрештою, компанія закрила Duplex AI наприкінці 2022 року.
Існують також зловмисні варіанти використання голосових клонів ІІ, від розпалювання ненависті та переслідувань ІІ до простого шахрайства. Цілком ймовірно, що в найближчому майбутньому виявиться практично неможливо визначити, чи дійсно це людина на іншому кінці дроту.