
Google ha actualizado sus herramientas de accesibilidad en Android y el navegador Chrome para ampliar sus capacidades de la mano de la inteligencia artificial (IA) y los modelos Gemini, lo que permite preguntar sobre una imagen con TalkBack acceder a subtítulos en tiempo real que van más allá de lo que dicen las personas.
La herramienta TalkBack, diseñada para que personas ciegas o con visión reducida puedan interactuar con el dispositivo, incorporó el año pasado las capacidades de Gemini para ofrecer descripciones de las imágenes.
Este año, Google ha actualizado la integración con su inteligencia artificial para que los usuarios puedan preguntar sobre la imagen descrita y obtener información. Eta forma de interactuar, demás, se extiende a toda la pantalla, por ejemplo, durante el proceso de compra en una página web.
Para las personas con discapacidad auditiva, la IA de Google también impulsa los 'Subtítulos Expresivos', una nueva función que ofrece subtítulos no solo de lo que dice la gente sino también, de cómo lo dice, e incluso incorpora etiquetas para informar de sonidos, como un silbido o un carraspeo, como explica en su blog oficial.
Esta novedad, que actúa en tiempo real y en la mayoría de las aplicaciones, está disponible en inglés en Estados Unidos, Reino Unido, Canadá y Australia para dispositivos con Android 15 y versiones posteriores.
Los equipos Chromebook han incorporado nuevas funciones de accesibilidad dirigidas a los estudiantes con discapacidad, para que puedan navegar por el ordenador con gestos faciales y personalizar la experiencia de lectura.
En lo que respecta al navegador Chrome, que más de 2.000 millones de personas utilizan cada día, , con el reconocimiento óptico de caracteres (OCR) reconoce automáticamente un PDF escaneado, lo que permite resaltar, copiar y buscar texto y usar el lector de pantalla para leerlo.
Zoom de página, por su parte, permite ampliar el tamaño del texto en Chrome para Android, sin que ello afecte al diseño de la página ni a la navegación por la web.
PROYECTO EUPHONIA
Proyecto Euphonia nació en 2019 como una iniciativa destinada a mejorar el reconocimiento de voz en más idiomas y contextos culturales, para que esta tecnología sea más accesible para las personas con un habla no estándar.
Desde entonces, Google ha apoyado a los desarrolladores, a quienes ofrece repositorios de código abierto a través de la página de GitHub, con el fin de mejorar el ecosistema de herramientas a nivel mundial.
A principios de año se creó el Centro para la Inclusión del Lenguaje Digital (CDLI), una iniciativa de Google.org y University College London con la que buscan mejorar la tecnología de reconocimiento de voz en diez idiomas africanos, con conjuntos de datos de código abierto y el desarrollo de nuevos modelos.
Últimas Noticias
Mueren unas 30 personas en nuevos enfrentamientos intercomunitarios en Sudán del Sur
Las autoridades informan que al menos 27 han perdido la vida y numerosas viviendas quedaron destruidas en Kogi, tras choques armados entre clanes locales en Ecuatoria Central, lo que ha provocado desplazamientos masivos y elevado la tensión regional

Pedro Sánchez: "Las medallas de Oriol Cardona y Ana Alonso son una proeza para el deporte español"
El presidente español celebró en redes sociales los históricos logros de Ana Alonso y Oriol Cardona, quienes obtuvieron preseas en los Juegos Olímpicos de Invierno, marcando un acontecimiento sin precedentes para la representación nacional en esquí de montaña

Meta separará Horizon Worlds de la plataforma Quest VR para enfocarse en su uso en 'smartphones'

Los abogados del expresidente Yoon Suk Yeol defienden su inocencia y buscan "luchar hasta el final"
El exmandatario de Corea del Sur recibe cadena perpetua tras ser hallado culpable de insurrección por declarar la ley marcial, mientras su defensa denuncia un juicio injusto y promete recurrir, en medio de un país polarizado por el veredicto

Desaparecidos siete turistas chinos tras hundirse un vehículo que intentaba cruzar el hielo en el lago Baikal
