О звуке простыми словами42Производители Hi-Fi.
Истории и интервью111Репортажи с заводов65Репортажи с Hi-Fi выставок69"Сделай сам"44Готовые проекты Аудиомании42Пресса об Аудиомании50Видео494Фотогалерея100Интересное о звуке804Новости мира Hi-Fi2545Музыкальные и кинообзоры616Глоссарий
Искуственный голос, неотличимый от человеческого
Любые попытки «очеловечить» искусственный интеллект пока приводят к результатам, которые кажутся или забавными, или зловещими. Однако компания Nvidia похоже, добилась некоторых успехов. Искусственный голос, который Nvidia недавно представила на технической конференции Interspeech, почти неотличим от человеческого.
Добиться такого результата удалось после того, как группа разработчиков Nvidia использовала «музыкальный» подход: человеческую речь приравняли к музыке с её сложными нюансированными ритмами, тонами и тембрами, которые крайне нелегко воспроизвести. В «речи» созданного Nvidia искусственного рассказчика нет звуковых артефактов, присущих синтезированным голосам.
Модель, разработанную в Nvidia, сначала обучили преобразывать любой вводимый текст в речь. После этого её научили разговаривать «правильно», в соответствии с человеческими интонациями. В компании считают, что потенциал разработки Nvidia гораздо шире, чем использование в «умных» устройствах и пр. «Преобразование текста в речь поможет людям с нарушениями голоса; новую разработку можно применять в онлайн-переводчиках – переводимые фразы будут звучать голосами общающихся людей».
Подготовлено по материалам портала "Avreport.ru", сентябрь 2021 г. www.avreport.ru