OpenAI продемонструвала технологію створення синтетичних голосів

Час читання: 2 хв.

Компанія OpenAI офіційно представила нейромережну модель генерації голосів Voice Engine, розробка якої велася з кінця 2022 року. Їй достатньо лише 15-секундного зразка аудіозапису для створення синтетичного голосу. Після цього штучний інтелект здатний генерувати аудіозаписи за заданим текстом, у тому числі різними мовами.

Фактично технологія Voice Engine вже використовується в чат-боті ChatGPT для озвучування тексту, що генерується. Тільки там застосовуються попередньо встановлені голоси, тоді як нова технологія потенційно здатна імітувати будь-який голос. Тому OpenAI поки не готова до масштабного розгортання нейромережі, побоюючись можливості її використання в несумлінних цілях.

«Ми сподіваємося розпочати діалог про відповідальне використання синтетичних голосів та про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих розмов та результатів невеликих випробувань ми ухвалимо більш виважене рішення про те, чи варто впроваджувати цю технологію в широких масштабах», – йдеться у блозі компанії .

На сайті OpenAI представлені приклади роботи Voice Engine та кілька потенційних прикладів використання технології:

Допомоги в читанні дітям і людям, які не вміють або не здатні читати, за допомогою природних, емоційних голосів, що представляють ширший діапазон дикторів, ніж це можливо при використанні попередньо встановлених голосів.
Переклад контенту, наприклад, відеороликів та подкастів, що дозволить авторам та компаніям донести інформацію до більшої кількості людей по всьому світу, використовуючи власні голоси.
Охоплення глобальних спільнот шляхом покращення надання основних послуг у віддалених районах.
Використання людьми із захворюваннями, що впливають на мовлення.
Допомога людям у відновленні голосу, які страждають від раптових чи дегенеративних захворювань мови.

Партнери OpenAI, які отримали доступ до Voice Engine, погодилися з політикою компанії, яка забороняє видавати себе за іншу фізичну особу чи організацію без згоди чи законного права.

«Ми вважаємо, що будь-яке широке впровадження технології синтетичного голосу має супроводжуватися голосовою автентифікацією, яка підтверджує, що оригінальний диктор свідомо додає свій голос у сервіс, та списком заборонених голосів, який виявляє та запобігає створенню голосів, надто схожих на відомих особистостей», — підкреслює компанія.

ЗАРАЗ ЧИТАЮТЬ

Samsung може обмежити виробництво Galaxy S25 Slim

В мережу потрапили нові фото смартфонів iPhone 17

Telegram повідомив, скільки груп і каналів було заблоковано у 2024 році

Apple представить iPhone SE 4 з оновленими функціями та дизайном

Google додала панель закладок у Chrome на Android

Користувачі Windows 11 скаржаться на проблеми після незначного оновлення

Google Pixel 9a повністю розсекречено: гідний конкурент iPhone SE 4

Apple розглядає можливість випуску великого складного iPad

Windows представила нову функцію для користувачів iPhone

У чому різниця між акумуляторами iPhone 16 та Android

Вас також можуть зацікавити новини:

Xiaomi випустила ручку-перекладач з розпізнаванням тексту для професіоналів

OpenAI запустила новий AI-інструмент для створення відео

Не пропустіть

Фахівці визнали iPhone 16 Pro Max найкращим iPhone у 2024 році

Xiaomi випустила ручку-перекладач з розпізнаванням тексту для професіоналів

Ілон Маск: Tesla зосередиться на роботах Optimus, а не на автомобілях

Розкрито ціну унікального iPhone 17 Air

Samsung додає новий геймерський режим у One UI 7 для Galaxy...

Функцію зйомки екрана в Windows 11 звинуватили у крадіжці даних банківських...

СВІЖІ НОВИНИ

Фахівці визнали iPhone 16 Pro Max найкращим iPhone у 2024 році

Xiaomi випустила ручку-перекладач з розпізнаванням тексту для професіоналів

Ілон Маск: Tesla зосередиться на роботах Optimus, а не на автомобілях

Розкрито ціну унікального iPhone 17 Air

Samsung додає новий геймерський режим у One UI 7 для Galaxy смартфонів

Функцію зйомки екрана в Windows 11 звинуватили у крадіжці даних банківських кар

Xiaomi представить клавіатуру з вбудованим дисплеєм

Перші рендери iPhone 17 Pro Max: що зміниться в дизайні

Топ-5 помилок, яких слід уникати під час встановлення Windows

Функції штучного інтелекту iPhone виявилися нецікавими користувачам