
Los chatbots de inteligencia artificial avanzan en traer nuevas funciones, y Google ha dado un nuevo salto con su modelo Gemini, que ahora incorpora la capacidad de “ver” en tiempo real lo que ocurre en la pantalla de un dispositivo o a través de su cámara.
Esta funcionalidad, basada en la tecnología de Project Astra, permite al chatbot analizar contenido visual y generar respuestas contextuales, que hasta el momento se ha visto solo en usuarios suscritos a Google One, pero que no se descarta que pueda estar disponible para todos los usuarios próximamente.
PUBLICIDAD
La tecnología Project Astra fue presentada por Google hace aproximadamente un año como una herramienta para dotar a la inteligencia artificial de capacidades multimodales. Esto significa que el sistema puede procesar datos provenientes de diferentes fuentes, como texto, imágenes y video, para ofrecer respuestas más completas y precisas.

Ahora, esta tecnología se ha integrado plenamente en Gemini, permitiendo que el modelo no solo interprete texto, sino además, lo que ocurre en la pantalla de un celular o lo que capta la cámara en tiempo real.
PUBLICIDAD
Cuál es el gran cambio que tendrá Gemini en los teléfonos
La implementación de esta tecnología en Gemini se traduce en una experiencia más inmersiva y práctica para los usuarios. El chatbot ahora puede analizar videos en tiempo real y generar conversaciones basadas en el contenido visual.
Esta nueva funcionalidad abre un abanico de posibilidades, desde resolver problemas técnicos hasta proporcionar información detallada sobre lo que se muestra en pantalla.
Qué funciones nuevas integra la inteligencia artificial de Google

Entre las nuevas funciones destacadas se encuentra la opción de grabación de pantalla en tiempo real. Con esta herramienta, los usuarios pueden activar un botón que permite a Gemini observar todo lo que ocurre en su dispositivo. Esto incluye navegar por sitios web, disfrutar de videojuegos o reproducir videos.
PUBLICIDAD
Mientras tanto, el usuario puede interactuar con el chatbot, formulando preguntas o solicitando aclaraciones sobre el contenido que se está mostrando, una característica que convierte a Gemini en una herramienta versátil y muy funcional para una amplia gama de escenarios.
Cómo estas nuevas funcionalidades mejoran la experiencia del usuario
La capacidad de Gemini para interpretar contenido visual en tiempo real tiene implicaciones esenciales en diversos campos. Esta tecnología podría ser utilizada en áreas como la educación, donde los estudiantes podrían recibir explicaciones detalladas sobre videos o imágenes en tiempo real.
PUBLICIDAD

También, podría tener aplicaciones en el ámbito profesional e investigativo, facilitando tareas como la revisión de documentos visuales o la resolución de problemas técnicos.
Además, la integración de Project Astra en Gemini representa un avance hacia una interacción más natural y fluida entre humanos y máquinas. Al permitir que la inteligencia artificial “vea” y comprenda el contexto visual, se reduce la necesidad de explicaciones verbales o escritas, lo que agiliza la comunicación y mejora la experiencia del usuario.
PUBLICIDAD
Cómo está la competencia en el mercado de la inteligencia artificial
La incorporación de estas capacidades coloca a Gemini en una posición destacada dentro del competitivo mercado de la inteligencia artificial. Según análisis de varios expertos, esta tecnología es comparable a la anunciada previamente por OpenAI, que también trabaja en dotar a sus modelos de capacidades visuales.

Algo que diferente es que la implementación de Project Astra en Gemini parece haber sido diseñada para maximizar la utilidad y la accesibilidad para el usuario final, lo que podría darle una ventaja frente a sus competidores.
PUBLICIDAD
Cuándo podría estar estas novedades en la versión gratuita de Gemini
Google ha estado en una constante carrera por mejorar y expandir las capacidades de Gemini. En los últimos meses, la compañía ha lanzado actualizaciones, muchas de las cuales han incluido funciones que anteriormente eran exclusivas de los planes de pago, pero que ahora están disponibles de forma gratuita para los usuarios.
Esta estrategia podría ser una estrategia para buscar atraer a más usuarios, y así consolidar a Gemini como una de las herramientas de inteligencia artificial más avanzadas y accesibles del mercado.
PUBLICIDAD
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Demis Hassabis, CEO de Google DeepMind, revela qué habilidades humanas no podrán ser reemplazadas por la IA
Mientras la IA avanza hacia capacidades cada vez más sofisticadas, Demis Hassabis identifica las fortalezas humanas que seguirán marcando la diferencia

Chatbots en auge en Estados Unidos: los más jóvenes lideran el uso y también el escepticismo
Casi la mitad de los adultos consulta asistentes de IA, pero la mayoría teme por la velocidad de su avance y duda de la capacidad tanto del gobierno como de las empresas para controlarla. Los menores de 30 años, principales usuarios, expresan las mayores preocupaciones sobre el futuro de la tecnología

GTA 6 precio en preventa: cuánto cuesta el juego de Rockstar en Argentina, Colombia, México y España
La reserva de cualquier edición de incluye el acceso a un pack inspirado en Vice City

El CEO de Epic Games criticó a Valve por etiquetar los juegos creados con IA en Steam
Tim Sweeney sostiene que la obligación de informar ese recurso expone a los desarrolladores al rechazo del público y complica el éxito comercial

Epic Games Store ofrece dos juegos gratis esta semana: parques de atracciones y batallas de dioses en tu PC
Los dos títulos se pueden reclamar sin costo del 25 de junio al 2 de julio y quedan guardados de forma permanente en la cuenta




