Investigadores de la Universidad de Washington desarrollaron auriculares que aíslan automáticamente las voces de los interlocutores. (Imagen Ilustrativa Infobae)

En espacios concurridos, donde el ruido de conversaciones, música y platos dificulta la comunicación, un avance tecnológico reciente promete transformar la experiencia auditiva: un equipo de la Universidad de Washington ha desarrollado un prototipo de auriculares que, mediante inteligencia artificial, pueden aislar automáticamente las voces de los interlocutores del usuario y suprimir el ruido de fondo y otras conversaciones.

Este desarrollo representa un paso importante para personas con dificultades auditivas y para cualquier usuario que busque claridad en entornos ruidosos, al ofrecer una solución automática y no invasiva que podría redefinir la tecnología auditiva y la interacción cotidiana.

A diferencia de tecnologías previas, que requerían intervención manual o incluso métodos invasivos, el prototipo presentado funciona de manera autónoma. Los auriculares detectan quiénes participan en la conversación y silencian las voces que no coinciden con el ritmo natural de los turnos de palabra.

El prototipo utiliza inteligencia artificial para identificar los participantes de una conversación y filtrar los sonidos ajenos, sin necesidad de intervención manual.

El sistema utiliza dos modelos de inteligencia artificial: uno analiza los patrones temporales del diálogo para identificar a los interlocutores, mientras que el otro filtra los sonidos no relacionados. En un lapso de dos a cuatro segundos, los auriculares reconocen y aíslan las voces relevantes, eliminando la necesidad de que el usuario seleccione manualmente a quién escuchar o ajuste parámetros de distancia.

El funcionamiento técnico se basa en la observación de que, durante una conversación, las personas siguen un ritmo de turnos de palabra que puede predecirse y rastrearse solo a partir del audio. El sistema se activa cuando el usuario comienza a hablar; en ese momento, el primer modelo determina quién habló y cuándo, buscando una baja superposición entre los participantes.

Posteriormente, el segundo modelo limpia la señal y devuelve en tiempo real el audio aislado al usuario. Esta aproximación contrasta con métodos anteriores, que dependían de la selección manual de interlocutores o incluso del uso de electrodos implantados en el cerebro para rastrear la atención.

El sistema detecta quién habla mediante el ritmo de turnos de palabra y selecciona en segundos las voces relevantes, simplificando el proceso para el usuario. (Imagen Ilustrativa Infobae)

En las pruebas realizadas, el prototipo demostró su capacidad para gestionar conversaciones entre el usuario y hasta cuatro personas adicionales sin retrasos perceptibles. Once participantes evaluaron la experiencia, calificando la claridad, la supresión de ruido y la comprensión tanto con los filtros activados como desactivados.

Los resultados mostraron que la versión filtrada duplicó la puntuación en comparación con la experiencia sin filtros. Asimismo, el diseño actual elimina la necesidad de mirar a una persona específica o de ajustar burbujas de audio basadas en la distancia, lo que simplifica el uso respecto a prototipos anteriores.

No obstante, el sistema aún enfrenta retos en situaciones de habla caótica, como cuando varias personas interrumpen, hablan simultáneamente o se incorporan a la conversación en curso, lo que puede dificultar el seguimiento de los interlocutores. Los modelos han sido entrenados en inglés, mandarín y japonés, por lo que la adaptación a otros idiomas podría requerir ajustes adicionales.

Pruebas con usuarios demostraron que la versión filtrada de los auriculares mejora notablemente la claridad y comprensión del diálogo en espacios ruidosos. (Imagen Ilustrativa Infobae)

El prototipo actual utiliza auriculares comerciales de diadema y circuitos básicos, pero los investigadores prevén que la tecnología podrá miniaturizarse para integrarse en audífonos, auriculares intraurales o incluso gafas inteligentes. En trabajos relacionados, el equipo ha demostrado que modelos similares ya pueden funcionar en chips del tamaño de los empleados en audífonos.

El código subyacente de este avance es de código abierto, lo que facilita su desarrollo y adaptación futura. Esta tecnología anticipa la intención del usuario de manera automática y sin intervenciones invasivas, abriendo nuevas posibilidades para la accesibilidad y la interacción en entornos complejos.