Новини України та Світу

OpenAI продемонструвала технологію створення синтетичних голосів

Share
Час читання: 2 хв.

Компанія OpenAI офіційно представила нейромережну модель генерації голосів Voice Engine, розробка якої велася з кінця 2022 року. Їй достатньо лише 15-секундного зразка аудіозапису для створення синтетичного голосу. Після цього штучний інтелект здатний генерувати аудіозаписи за заданим текстом, у тому числі різними мовами.

Фактично технологія Voice Engine вже використовується в чат-боті ChatGPT для озвучування тексту, що генерується. Тільки там застосовуються попередньо встановлені голоси, тоді як нова технологія потенційно здатна імітувати будь-який голос. Тому OpenAI поки не готова до масштабного розгортання нейромережі, побоюючись можливості її використання в несумлінних цілях.

«Ми сподіваємося розпочати діалог про відповідальне використання синтетичних голосів та про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих розмов та результатів невеликих випробувань ми ухвалимо більш виважене рішення про те, чи варто впроваджувати цю технологію в широких масштабах», – йдеться у блозі компанії .

На сайті OpenAI представлені приклади роботи Voice Engine та кілька потенційних прикладів використання технології:

  • Допомоги в читанні дітям і людям, які не вміють або не здатні читати, за допомогою природних, емоційних голосів, що представляють ширший діапазон дикторів, ніж це можливо при використанні попередньо встановлених голосів.
  • Переклад контенту, наприклад, відеороликів та подкастів, що дозволить авторам та компаніям донести інформацію до більшої кількості людей по всьому світу, використовуючи власні голоси.
  • Охоплення глобальних спільнот шляхом покращення надання основних послуг у віддалених районах.
  • Використання людьми із захворюваннями, що впливають на мовлення.
  • Допомога людям у відновленні голосу, які страждають від раптових чи дегенеративних захворювань мови.

Партнери OpenAI, які отримали доступ до Voice Engine, погодилися з політикою компанії, яка забороняє видавати себе за іншу фізичну особу чи організацію без згоди чи законного права.

«Ми вважаємо, що будь-яке широке впровадження технології синтетичного голосу має супроводжуватися голосовою автентифікацією, яка підтверджує, що оригінальний диктор свідомо додає свій голос у сервіс, та списком заборонених голосів, який виявляє та запобігає створенню голосів, надто схожих на відомих особистостей», — підкреслює компанія.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
Tags: OpenAI
  • Останні записи

    iOS 18.1 змушує iPhone перезавантажуватися після трьох днів бездіяльності

    Коли вийшла iOS 18, Apple додала дуже цікаву фішку. Тепер iPhone автоматично перезавантажується кожні три…

    15.11.2024

    Як зрозуміти, що додаток збирає ваші дані без дозволу

    Щороку ми завантажуємо мільярди додатків на смартфони — щоб швидко спілкуватися, займатися банкінгом, редагувати фото…

    14.11.2024

    Google робить свій смартфон потужнішим за допомогою Linux

    В Android 15 QPR2 Beta 1 Google представила нову функцію - Terminal, що дозволяє запускати…

    14.11.2024

    Apple набирає обертів у галузі ШІ, поки конкуренти зволікають у розвитку

    Apple Intelligence з'явився тільки минулого місяця, і деякі з його найцікавіших функцій будуть доступні з…

    14.11.2024

    В Україні зросла кількість злочинів за участю популярних додатків

    За останні кілька років все частіше виявляється, що месенджери використовуються як інструменти для злочинів. З…

    14.11.2024

    Стало відомо, коли представлять смартфони Samsung Galaxy S25

    Схоже, компанія Samsung не буде вкотре зрушувати терміни запуску своїх флагманських смартфонів ближче до початку…

    14.11.2024