Весь Мир Hi-Fi

Новый ИИ Microsoft способен скопировать голос человека всего из трех секунд аудиозаписи

Компания Microsoft заявила о создании ИИ нового типа, который может с легкостью генерировать реалистично звучащую речь со всеми необходимыми интонациями. Инструмент получил имя «VALL-E». Самое любопытное, что ему достаточно проанализировать всего 3 секунды аудиозаписи голоса любого человека, чтобы идеально его скопировать.

Новый ИИ Microsoft копирует голос человека

Microsoft не раскрывает принципов работы нового ИИ, не собирается выкладывать его исходные коды и даже вряд ли создаст на основе VALL-E публичный коммерческий инструмент. Скорее, это эксперимент, промежуточная стадия в разработке дополнения к другой языковой модели – GPT-3. Конечной целью Microsoft, вероятно, является создание универсального генератора речи, который мог бы заменить работу людей при создании произвольного контента.

Главной сложностью, и разработчики этого не скрывают, является необходимость создать некие маркеры, которые помогли бы различать голос от ИИ от голосов реальных людей. Иначе такой инструмент быстро найдет применение у злоумышленников, ведь достаточно зайти на любую страничку в соцсетях и «позаимствовать» оттуда образцы голосов из многочисленных личных роликов пользователей. Что уж говорить про публичные выступления политиков и знаменитостей – с этим ИИ мошенники смогут с легкостью позвонить и выдать себя за известную личность в корыстных целях.

Подготовлено по материалам портала "Техкульт", январь 2023 г. www.techcult.ru

Эту статью прочитали 1 589 раз

Статья входит в разделы:Новости мира Hi-Fi

Поделиться материалом:

Почитать еще:

10 августа 2018RHA представила беспроводные наушники MA390 Wireless
6 февраля 2023Pro-Ject X8 Evolution впечатлил журнал Hi-Fi Test
12 ноября 2024Фигуры, парящие над водой: электронуар в точке невербальных контактов

Обсуждение данного материала

Комментариев пока нет. Станьте первым!

Написать свой комментарий