Categories: Ґаджети

Google сумела максимально точно синтезировать человечный голос

Share
Час читання: < 1 хв.

Компания Google завершила разработку технологии Tacotron второго поколения, позволяющей преобразовывать текст в речь. Поисковый гигант уже многие годы работает над совершенствованием машинной речи для своих сервисов вроде Google Assistant, «Переводчик», «Карты» и другие. Инженерам Google удалось добиться такого результата, что теперь синтетическую речь сложно отличить от человеческой.

Новая технология учитывает пунктуацию, правильно расставляет ударения, а слова, начинающиеся с заглавной буквы, будь то имена, названия городов или ещё что-то, выделяются, так как они являются важной частью предложения. Для достижения такого результата используется две нейронные сети. Первая превращает обычный текст в спектрограмму — визуальное представление звуковых частот. Полученный результат отправляется во вторую сеть под названием WaveNet, разработанную британской компанией DeepMind, которая занимается изучением искусственного интеллекта. Она и выполняет все последующие операции.

WaveNet уже используется в английской и японской версиях Google Assistant, а вскоре будет применена и в других языках. Основным преимуществом WaveNet над аналогами является возможность работать в полностью автономном режиме. Ей не нужен доступ к большой базе данных предварительно записанных звуков. Вместо этого сеть генерирует собственные звуки, основанные на спектрограммах, подаваемых ей первой нейронной сетью.

Оценить качество машинной речи Google можно по ссылке. Важно отметить, что в одной записи используется голос реального человека, а во второй — созданный Tacotron 2.

Источник: 4PDA

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
  • Останні записи

    За прогнозами, наступного року Apple випустить iPhone з тоншими OLED-дисплеями

    Тайванська компанія Novatek оголосила про плани розпочати масове виробництво OLED-дисплеїв з технологією TDDI (touch and…

    04.10.2024

    OpenAI запустив новий інтерфейс Canvas для ChatGPT

    OpenAI, лідер у галузі штучного інтелекту, анонсував інструмент Canvas, що спрощує роботу з текстом та…

    04.10.2024

    Telegram готує повноцінну заміну для YouTube

    Розробники Telegram оголосили про проведення конкурсу. Учасникам пропонується створити для iOS-версії Telegram плеєр, який може відтворювати відео…

    04.10.2024

    iPhone можуть отримати режим «гостя»

    Apple запатентувала гостьовий режим для iOS Він дозволить передати айфон другові чи дитині, не побоюючись,…

    04.10.2024

    Google тестує нову функцію для боротьби з фейковими сайтами

    Google тестує нову функцію, щоб допомогти користувачам знаходити надійні компанії у мережі. В рамках експерименту,…

    04.10.2024

    YouTube масово блокує акаунти та канали по всьому світу, але проблему можна вирішити

    Деякі користувачі YouTube зіткнулися з блокуванням своїх облікових записів або каналів. Поштою їм надійшло повідомлення…

    04.10.2024