Искуственный голос, неотличимый от человеческого

Любые попытки «очеловечить» искусственный интеллект пока приводят к результатам, которые кажутся или забавными, или зловещими. Однако компания Nvidia похоже, добилась некоторых успехов. Искусственный голос, который Nvidia недавно представила на технической конференции Interspeech, почти неотличим от человеческого.



Мужчина, сидящий перед монитором

Добиться такого результата удалось после того, как группа разработчиков Nvidia использовала «музыкальный» подход: человеческую речь приравняли к музыке с её сложными нюансированными ритмами, тонами и тембрами, которые крайне нелегко воспроизвести. В «речи» созданного Nvidia искусственного рассказчика нет звуковых артефактов, присущих синтезированным голосам.

Модель, разработанную в Nvidia, сначала обучили преобразывать любой вводимый текст в речь. После этого её научили разговаривать «правильно», в соответствии с человеческими интонациями. В компании считают, что потенциал разработки Nvidia гораздо шире, чем использование в «умных» устройствах и пр. «Преобразование текста в речь поможет людям с нарушениями голоса; новую разработку можно применять в онлайн-переводчиках – переводимые фразы будут звучать голосами общающихся людей».


Подготовлено по материалам портала "Avreport.ru", сентябрь 2021 г. www.avreport.ru

Эту статью прочитали 3 093 раза
Статья входит в разделы:Новости мира Hi-Fi

Поделиться материалом:
Обсуждение данного материала
1 октября 2021, 13:53
Юрий (Гость)
отличная статья, я ее бы на своем сайте http://site516.ru перепостил, если вы не против
Написать свой комментарий