В США нейросеть нарисовала портрет по голосу

16:50 , 28 мая 2019

Время чтения: 1 мин

1452

Американские разработчики из Массачусетского технологического института разработали нейросетевую модель Speech2Face. Данная программа способна по сонограмме речи человека создавать изображение его лица, базируясь при этом на 3 ключевых параметрах: расе, поле и возрасте.

Программа по голосу даже может определить некоторые особенности человека, к примеру, его национальность и индивидуальные черты. В результате этого можно приблизительно представить, как выглядит человек, однако это изображение, конечно, не будет достаточно точным. Специалисты загрузили в нейросеть больше миллиона коротких видеороликов с разговорами свыше 100 тыс. человек. Программа проанализировала голоса. При этом чтобы оценить точность работы, исследователи сравнили пол, этнические характеристики, примерный возраст человека на видео и портрета, созданного по голосу.

В результате модель достаточно неплохо распознала все индивидуальные особенности каждого человека. Программа хорошо угадывает пол, однако редко определяет возраст с точностью до 10 лет. Лучше всего нейросеть рисует европейцев и азиатов. Эксперты объясняют эту особенность неравномерным распределением рас в выборке.

Islam-today

США Технологии Нейросеть

Если вы нашли ошибку, выделите текст и нажмите Ctrl + Enter.