
¿La voz puede delatar cómo se ve una persona? Pareciera ser que sí. O al menos esa es la idea detrás de Speech2Face, un sistema de aprendizaje automático capaz de adivinar el rostro de una persona por cómo suena su voz.
Según explican los investigadores del MIT Tae-Hyun Oh, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman, Michael Rubinstein, Wojciech Matusik, que están detrás de este proyecto, se entrenó una red neuronal para desarrollar esta tarea utilizando millones de videos de miles de personas hablando en YouTube y otros clips publicados en la web.
Durante la fase de entrenamiento, el sistema estableció correlaciones entre los atributos físicos de la persona, como edad, género y grupo étnico y el timbre de su voz.
La inteligencia artificial aprendió esas relaciones y las puede usar para adivinar o intuir cómo es el rostro de una nueva persona con tan solo escuchar un pequeño fragmento de su voz.

Cabe destacar que el sistema no es capaz de reconstruir exactamente cómo es el rostro de la persona, sino que tan sólo puede elaborar una imagen que surge de esas relaciones aprendidas.
"Esto se debe a que nuestro modelo está entrenado para capturar las características visuales (relacionadas con edad, género, etc) que son comunes a varios individuos, tan sólo en los casos en los que hay suficiente evidencia para conectar esas características con los atributos en el habla que se encuentran en la base de datos", explican los investigadores en la publicación.
Por eso va a producir imágenes aproximadas en función de estos datos y no una foto detallada y perfecta de un individuo en particular.
Otro punto es que el modelo está diseñado en función de una base de datos que, por más que es amplia, no representa a toda la población que hay en el mundo, con lo cual los resultados van a ser parciales y seguramente requiera mayores ajustes.
Uno de los desafíos dentro del machine learning es contar con una nutrida base de información que sea lo más representativa de la realidad, algo que, muchas veces, es difícil de lograr.
MÁS SOBRE ESTE TEMA:
Últimas Noticias
Temblor en México hoy: noticias de la actividad sísmica este domingo 8 de marzo de 2026
Sigue en vivo todas las actualizaciones sobre movimientos telúricos emitidas por el SSN

Radiografía de la carrera de Colapinto en el GP de Australia de F1: un error de Alpine lo complicó, pero se defendió para cerrar un buen debut
El argentino fue 14º en Melbourne en lo que fue la apertura de la temporada. Se destacó por sus reflejos en la largada y en la administración de los neumáticos

Cae automóvil desde sexto nivel de un edificio en Cuajimalpa, deja tres personas lesionadas
Las víctimas recibieron atención prehospitalaria por parte de los cuerpos de emergencia y fueron trasladadas para su valoración definitiva

¿Por qué 1.000 barcos a veces pierden su GPS en Medio Oriente?
Las señales no sólo se utilizan para determinar la ubicación; también alimentan relojes de a bordo, sistemas de radar y registros de velocidad
Tigres se lleva la victoria en el Volcán con el que apunta a ser el último gol de Gignac en un Clásico Regio
El francés anota su posible último gol en el Clásico Regio y le otorga una victoria fundamental a los felinos de cara al cierre del torneo regular

