Google створив систему синтезу мови, яка майже не відрізняється від людини

Google створив систему синтезу мови, яка майже не відрізняється від людини

Укрінформ
Google розробила просунутий синтезатор мови нового покоління. Він називається Tacotron 2 і заснований на нейромережі

Система перетворення тексту на природну для вуха мову Tacotron 2 виконує це завдання ефективніше за своїх попередників Tacotron і WaveNet, пише TechCrunch.

Попередні системи генерації мови мали ряд істотних недоліків. WaveNet, приміром, видавала дуже різкі звуки. Tacotron краще порався з інтонаціями, але не міг видавати повноцінний "мовний продукт".

Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограмму, в якій розподіляються ритм і наголоси, а слова генеруються в аналогу WaveNet. Крім того, додана система збору даних для навчання нейромережі, пише "Новое время".

Читайте також: Google "вб'є" мільйони додатків для Android-смартфонів

Аудіозапис справді схожий на мову живої людини. Темп мовлення звучить досить переконливо, а основні затримки відбуваються на словах з незвичайною вимовою. Щоправда, частина слухачів у коментарях стверджує, що деякі слова система вимовляє "ламано".

Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, одразу почне використовуватися в продуктах компанії.

Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яка фраза буде виголошена піднесено, а яка — грубо.

Розширений пошукПриховати розширений пошук
За період:
-