Google заговорив людським голосом

Google заговорив людським голосом

Google розробила сучасний синтезатор мови нового покоління - Tacotron 2. Технологію, швидше за все, відразу почнуть використовувати в продуктах компанії.

Система перетворення тексту в голосове мовлення справляється з завданнями значно якісніше попередників - Tacotron і WaveNet. Останні мали ряд недоліків: WaveNet видавала дуже різкі звуки, а Tacotron краще справлявся з інтонаціями, але не міг виробляти якісний "мовний продукт".

 


Алгоритм Tacotron 2 працює завдяки двом нейронним мережам. Друкована версія трансформується в спеціальну Tacotron-спектрограмму, у якій правильно розподіляють ритм і наголоси в словах.

Аудіозапис дійсно нагадує мову живої людини, а не машини. Темп, інтонація і наголоси звучать переконливо. Основні запинки відбуваються на словах з нетрадиційною вимовою.


ЧИТАЙТЕ ТАКЖЕ:
Коментарі (0)
Додати новий коментар

Filtered HTML

  • Адреси сторінок і електронної пошти автоматично перетворюються у посилання.
  • Дозволені теґи HTML: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Рядки і абзаци переносяться автоматично.

Plain text

  • Не дозволено жодних HTML теґів.
  • Адреси сторінок і електронної пошти автоматично перетворюються у посилання.
  • Рядки і абзаци переносяться автоматично.

my_format

  • Дозволені теґи HTML: <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Рядки і абзаци переносяться автоматично.