Искусственный интеллект научился имитировать человеческий голос - «Финансы и Банки» » Финансы и Банки
Создать акаунт

Искусственный интеллект научился имитировать человеческий голос - «Финансы и Банки»

12 мар 2018, 03:00
Новости Банков
0
0
Искусственный интеллект научился имитировать человеческий голос - «Финансы и Банки»
Искусственный интеллект научился имитировать человеческий голос - «Финансы и Банки»

Технология под названием Deep Voice работает на основе машинного обучения: она “тренировалась” на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.
Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр.
Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.
“Это настоящий прорыв с технической точки зрения, – говорит один из авторов разработки Лео Зу (Leo Zou). – Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями”.

Технология под названием Deep Voice работает на основе машинного обучения: она “тренировалась” на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов. Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент. “Это настоящий прорыв с технической точки зрения, – говорит один из авторов разработки Лео Зу (Leo Zou). – Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями”.

Смотрите также:


Комментарии
Минимальная длина комментария - 50 знаков. комментарии модерируются
Top.Mail.Ru