Корпорация Google является одной из самых крупных во всем мире. У нее есть свои представительства в более чем 60 странах мира. Поскольку общий штат ее сотрудников исчисляется десятками тысяч, то ей под силу создавать такие вещи, которые никто другой реализовать просто не в состоянии. Считанные часы назад «поисковой гигант» сообщил о завершении реализации проекта Tacotron 2, над которым он работал несколько лет.
Американская корпорация Google сумела сделать то, что не удавалось всему человечеству более 100 лет. На протяжении практически целого века все люди хотят сделать так, чтобы голос робота был абсолютно полностью идентичен голосу реального живого человека. Проект Tacotron 2 стал первым в мире, который сумел воплотить эту задумку в жизнь. Как утверждает «поисковой гигант», ей сотрудники после нескольких лет усердной работы сумели создать систему и алгоритмы, позволяющие генерировать искусственный голос, который неотличим от реального человеческого.
Проект Tacotron 2 состоит сразу из двух нейронных сетей, одна из которых преобразует текст в специальную спектрограмму, а вторая под названием WaveNet осуществляет воспроизведение созданной диаграммы с помощью интерпретации, в результате чего генерируется голос, который невозможно отличить от речи обычного живого человека. Особенность новой технологии в том, что она не звучит как «голос робота», а верно произносит все словам, независимо от того, насколько они сложны в произношении.
По словам Google, сейчас сотрудники проекта Tacotron 2, которым удалось сделать то, что не удавалось всему человечеству более 100 лет, работают над обучением своей фирменной технологии. Они хотят сделать так, чтобы она в совершенстве овладела английским языком, чтобы затем ее можно было использовать по всему миру. Пока что она новинка говорит только одним единственным женским голосом, но в скором будущем она может освоить и другие голоса.
Не менее интересно и то, что голосовая система Tacotron 2 способна выделять в тексте какие-то ключевые моменты и фразы, делая на них акция во время озвучки. Так, например, если слово написано с заглавной буквы, то ей будет сделан на этом акцент, за счет чего все слова, предложения и тексты, которая она озвучивает, звучат не хуже, чем если бы их произносил живой человек с помощью своего речевого аппарата.