¿La voz puede delatar cómo se ve una persona? Pareciera ser
que sí. O al menos esa es la idea detrás de Speech2Face, un sistema de aprendizaje automático capaz de adivinar el
rostro de una persona por cómo suena su voz.
Según explican los investigadores del MIT Tae-Hyun Oh,
Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman, Michael Rubinstein,
Wojciech Matusik, que están detrás de este proyecto, se entrenó una red
neuronal para desarrollar esta tarea utilizando millones de videos de miles de
personas hablando en YouTube y otros clips publicados en la web.
Durante la fase de entrenamiento, el sistema estableció
correlaciones entre los atributos físicos de la persona, como edad, género y
grupo étnico y el timbre de su voz.
Formulario de contacto