• Новини
  • Наука

Google створив систему синтезу мови нового покоління

Система перетворення тексту в голосове мовлення справляється із завданнями значно якісніше за попередників — Tacotron і WaveNet.

Попередні системи генерації мови мали ряд істотних недоліків. Перша перетворює текст на спектрограмму і передає алгоритмом WaveNet, який озвучує її, генеруючи відповідні звукові елементи.

Google створив синтезатор мови «Tacotron 2», заснований на нейромережі. Tacotron краще порався з інтонаціями, але не міг видавати повноцінний «мовний продукт». Друкована версія трансформується в спеціальну Tacotron-спектрограму, в якій правильно розподіляють ритм і наголоси в словах, пише nv.ua. Аудіозапис схожий на вимову живої людини. Щоправда, частина слухачів у коментарях стверджує, що деякі слова система вимовляє «ламано». Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії.

Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яку фразу програма проговорить піднесено, а яку — грубо.




Актуальні новини



Рекомендовані новини

Адвокат: Син Нестора Шуфрича отримав рік умовно за ДТП
Учасники АТО заблокували автовокзал у Дніпрі
Німеччина та Франція привітали обмін полоненими на Донбасі
Порошенко назвав умови для відновлення закупівель газу у Росії
СБУ: Україна не передала бойовикам свідка у справі про збитий MH17
П’яний українець фурою протаранив патрульне авто у Німеччині, загинула полісменка
Суд поновив на посаді начальника карного розшуку поліції Києва
Ліга чемпіонів на «Донбас Арені»: Ахметов виступив з гучною заявою
У Москві затримали опозиціонера Яшина
ВРП рекомендує Порошенку призначити голову Ради суддів Сімоненко суддею Верховного суду