Meta lleva la transcripción de voz a texto a más de 1.600 idiomas, 500 de ellos por primera vez

Guardar

Meta ha presentado un modelo con capacidades de reconocimiento automático del habla para más de 1.600 idiomas, incluidos los menos representados, que considera "un avance significativo hacia un sistema de transcripción verdaderamente universal".

La compañía tecnológica ha presentado las nuevas herramientas con las que busca reducir la brecha que existe con la tecnología de reconocimiento automático del habla, para que los sistemas de conversión de voz a texto de alta calidad lleguen también a los idiomas menos hablados y con pocos recursos.

Una de esas herramientas es Omnilingual ASR, un conjunto de modelos que ofrece reconocimiento automático del habla en más de 1.600 idiomas, incluyendo 500 idiomas que nunca antes habían sido transcritos por IA. Para la compañía, "representa un avance significativo hacia la creación de un sistema de transcripción verdaderamente universal".

Según sus datos, Omnilingual ASR "alcanza un rendimiento de vanguardia en más de 1.600 idiomas, con tasas de error de caracteres inferiores al 10% en el 78% de ellos". Los idiomas con pocos recursos y menos de diez horas de entrenamiento presentan tasas de error de caracteres inferiores al 10% en el 36 % de los casos.

Los sistemas de reconocimiento automático del habla requieren grandes cantidades de datos del idioma para poder realizar transcripciones con precisión. No todos cuentan con los recursos suficientes, por eso Meta ha introducido un enfoque basado en el aprendizaje contextual para que a partir de unos pocos ejemplos de audio y texto emparejados se puedan obtener transcripciones de calidad aceptable.

"Si bien el rendimiento sin ejemplos de aprendizaje aún no alcanza el de los sistemas completamente entrenados, ofrece una vía mucho más escalable para incorporar nuevos idiomas al ámbito digital", señala la compañía en su blog de IA.

Meta ofrece Omnilingual ASR en dos tamaños: con 7.000 millones de parámetros y con 300 millones de parámetros, este último para su uso en dispositivos de bajo consumo; y lo acompaña de su modelo de reconocimiento de voz de propósito general wav2vec 2.0. Todas estas herramientas están disponibles bajo una modalidad de código abierto.

Asimismo, ha facilitado el corpus Omnilingual ASR, que el conjunto de datos de entrenamiento de Omnilingual ASR, que es "uno de los más grandes jamás creados para este fin, tanto por su volumen como por su diversidad lingüística", y que "abarca cientos de lenguas nunca antes vistas por los sistemas de ASR".

Últimas Noticias

Israel acusa a Hezbolá de matar a posibles denunciantes de las causas de la explosión del puerto de Beirut

El ejército israelí señaló a una unidad de Hezbollah por la presunta muerte de cuatro figuras libanesas que podían revelar datos sobre el desastre portuario de 2020, denuncia que reaviva tensiones y reclamos por investigaciones estancadas

Israel acusa a Hezbolá de

Christian Wück: "España ha ganado merecidamente, no estuvimos a su altura en la segunda parte"

El entrenador del conjunto alemán destacó el dominio de las campeonas durante la última parte del encuentro y admitió que las jugadoras no lograron mantener la intensidad, señalando falta de eficacia y físico como claves de la derrota

Christian Wück: "España ha ganado

Jenni Hermoso: "Ha costado mucho y puedo seguir haciendo lo que me gusta"

Visiblemente emocionada tras el triunfo en Madrid ante Alemania, la delantera de la selección española resaltó el esfuerzo acumulado durante meses y la alegría de celebrar junto a familiares y aficionados en un ambiente que calificó como único y motivador

Jenni Hermoso: "Ha costado mucho

Alexia Putellas, elegida 'MVP' de la Liga de Naciones 2025

La centrocampista regresó tras lesión para impulsar a España con cinco goles y actuaciones decisivas, destacándose en semifinales ante Suecia y ante Portugal, papel reconocido por la organización al distinguirla como ‘Jugadora Más Valiosa’ del campeonato

Alexia Putellas, elegida 'MVP' de

Trump dice que los ataques dentro de Venezuela comenzarán "muy pronto"

Washington prevé lanzar incursiones armadas en territorio venezolano para enfrentar redes de narcotráfico tras identificar rutas y responsables, mientras advierte que posibles intervenciones también podrían extenderse hacia otras naciones sudamericanas relacionadas con el flujo de drogas ilícitas

Trump dice que los ataques