
¿La voz puede delatar cómo se ve una persona? Pareciera ser que sí. O al menos esa es la idea detrás de Speech2Face, un sistema de aprendizaje automático capaz de adivinar el rostro de una persona por cómo suena su voz.
Según explican los investigadores del MIT Tae-Hyun Oh, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman, Michael Rubinstein, Wojciech Matusik, que están detrás de este proyecto, se entrenó una red neuronal para desarrollar esta tarea utilizando millones de videos de miles de personas hablando en YouTube y otros clips publicados en la web.
Durante la fase de entrenamiento, el sistema estableció correlaciones entre los atributos físicos de la persona, como edad, género y grupo étnico y el timbre de su voz.
La inteligencia artificial aprendió esas relaciones y las puede usar para adivinar o intuir cómo es el rostro de una nueva persona con tan solo escuchar un pequeño fragmento de su voz.

Cabe destacar que el sistema no es capaz de reconstruir exactamente cómo es el rostro de la persona, sino que tan sólo puede elaborar una imagen que surge de esas relaciones aprendidas.
"Esto se debe a que nuestro modelo está entrenado para capturar las características visuales (relacionadas con edad, género, etc) que son comunes a varios individuos, tan sólo en los casos en los que hay suficiente evidencia para conectar esas características con los atributos en el habla que se encuentran en la base de datos", explican los investigadores en la publicación.
Por eso va a producir imágenes aproximadas en función de estos datos y no una foto detallada y perfecta de un individuo en particular.
Otro punto es que el modelo está diseñado en función de una base de datos que, por más que es amplia, no representa a toda la población que hay en el mundo, con lo cual los resultados van a ser parciales y seguramente requiera mayores ajustes.
Uno de los desafíos dentro del machine learning es contar con una nutrida base de información que sea lo más representativa de la realidad, algo que, muchas veces, es difícil de lograr.
MÁS SOBRE ESTE TEMA:
Últimas Noticias
Mujer acudió a urgencias por una fiebre y le amputaron los brazos y piernas en una clínica de Barranquilla
La experiencia de la ciudadana dejó preguntas entre la comunidad sobre la atención hospitalaria y el apoyo que reciben los pacientes después de una crisis médica tan compleja

Ministerio Público lanza convocatoria laboral con 96 puestos y sueldos de hasta S/ 4.935: revisa cómo postular en marzo 2026
Esta oportunidad de trabajo tiene plazas para personas con secundaria completa, estudiantes universitarios, egresados y bachilleres, en Lima y Apurímac

Valve sorprende con una actualización de la app de Steam: mejoras y cambios
Entre los cambios más destacados, la plataforma ahora permite a los usuarios añadir las especificaciones de su PC al momento de escribir una reseña

¿Por qué jugar nos hace sentir mejor? La UNAM explica cómo reduce el estrés
Un aprovechamiento adecuado de momentos libres mediante juegos estimula áreas cerebrales asociadas al placer y la planificación

Un error muy caro: Andrea Valdiri reveló que tras la fiesta de 15 años de Isabella terminó con una sorpresa en su casa
La creadora de contenido compartió en sus redes sociales que un fallo inesperado dejó varias tortas sin tocarse durante la celebración del cumpleaños de su hija mayor


