Google заговорив людським голосом

Google заговорив людським голосом

Google розробила сучасний синтезатор мови нового покоління - Tacotron 2. Технологію, швидше за все, відразу почнуть використовувати в продуктах компанії.

Система перетворення тексту в голосове мовлення справляється з завданнями значно якісніше попередників - Tacotron і WaveNet. Останні мали ряд недоліків: WaveNet видавала дуже різкі звуки, а Tacotron краще справлявся з інтонаціями, але не міг виробляти якісний "мовний продукт".

 

Алгоритм Tacotron 2 працює завдяки двом нейронним мережам. Друкована версія трансформується в спеціальну Tacotron-спектрограмму, у якій правильно розподіляють ритм і наголоси в словах.

Аудіозапис дійсно нагадує мову живої людини, а не машини. Темп, інтонація і наголоси звучать переконливо. Основні запинки відбуваються на словах з нетрадиційною вимовою.


Коментарі (0)
Коментувати

Filtered HTML

  • Адреси веб-сторінок та адреси електронної пошти автоматично перетворюються у посилання.
  • Дозволені теґи HTML: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
  • Рядки і абзаци переносяться автоматично.

my_format

  • Дозволені теґи HTML: <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
  • Рядки і абзаци переносяться автоматично.
Image CAPTCHA
Enter the characters shown in the image.