Ahora se puede hablar con Google Fotos para hacer tus ediciones

Además de operaciones habituales como mejorar la iluminación o borrar elementos no deseados, la función admite ediciones más creativas

Guardar
Para quienes no dominan los
Para quienes no dominan los conceptos técnicos de edición, la actualización de Google Fotos representa una solución de accesibilidad inédita. (Unsplash)

La última oleada de innovaciones en Google Fotos ofrece a los usuarios la capacidad de editar fotografías a través de simples solicitudes habladas o escritas. Sin duda, se trata de un nuevo giro a la relación cotidiana con la inteligencia artificial y la edición de imágenes.

Esta funcionalidad, que comenzará a estar disponible en los nuevos dispositivos Pixel 10 en Estados Unidos, permite pedirle a la aplicación cualquier tipo de ajuste con lenguaje natural, sin depender de conocimientos previos en herramientas de edición.

IA aplicada al retoque fotográfico

La opción de “editar preguntando” utiliza la tecnología de Gemini, el motor de inteligencia artificial de Google, para ejecutar tareas de modo intuitivo. El sistema permite dar instrucciones tan detalladas como “elimina los coches en el fondo” o tan generales como “mejora esta foto”. Incluso ante una duda sencilla, como “hazla mejor”, Google Fotos detecta y sugiere optimizaciones automáticas. Una vez realizado el primer ajuste, el usuario puede continuar pidiendo cambios adicionales, puliendo los resultados de manera incremental.

Además de operaciones habituales como mejorar la iluminación o borrar elementos no deseados, la función admite ediciones más creativas, tales como cambiar el fondo de la imagen o agregar elementos, desde algunos accesorios festivos hasta efectos insólitos. Esta versatilidad convierte la experiencia en una herramienta útil para quienes buscan resultados profesionales o simplemente desean divertirse personalizando imágenes.

Puedes pedirle a Gemini que
Puedes pedirle a Gemini que edite tus fotos. (Google)

Para quienes no dominan los conceptos técnicos de edición, el sistema representa una solución de accesibilidad inédita. Google destaca, además, que una vez disponible, el despliegue de la función se irá ampliando de manera gradual a dispositivos con iOS y Android, siguiendo la primera fase exclusiva de los Pixel 10. La característica estará operativa a partir del miércoles 20 de agosto.

Otra novedad relevante llega de la mano de la adopción del estándar C2PA Content Credentials en Google Fotos. Este protocolo busca incrementar la transparencia acerca del origen y la manipulación digital de las imágenes, informando si han sido editadas con inteligencia artificial y bajo qué condiciones. Los nuevos Pixel 10 serán los pioneros en el uso de este estándar no solo en Google Fotos, sino también desde la aplicación de cámara del dispositivo y en toda foto tomada con ella, aunque no se haya aplicado IA. Esta certificación aspira a ofrecer mayor seguridad y confianza tanto a usuarios finales como a creadores de contenido, ayudando a identificar la autenticidad de las imágenes en un entorno digital cada vez más dinámico.

La nueva función de Gemini para Google Docs

De forma paralela a los avances en fotografía, el paquete de Google Docs ha incorporado una función largamente demandada: la reproducción en voz alta de textos gracias a Gemini. El editor de documentos posibilita desde ahora convertir cualquier contenido en inglés en un archivo de audio, facilitando la experiencia para quienes requieren accesibilidad o desean consumir información sin necesidad de leer directamente. La personalización abarca distintos perfiles de entonación —Narrador, Profesor, Motivador, entre otros— y velocidades adaptativas, ajustándose a los objetivos o el tono deseado en cada ocasión.

El proceso para activar la
El proceso para activar la lectura en voz alta es intuitivo y no requiere conocimientos técnicos avanzados. (YouTube)

Esta innovación, actualmente disponible en la versión web de escritorio y limitada al idioma inglés, inició su despliegue hace pocos días para usuarios con suscripciones Workspace comerciales, empresariales o educativas, así como planes AI Pro y Ultra o el complemento Gemini Education Premium. Una vez activada desde el menú de herramientas, un reproductor compacto muestra la duración total del audio, y se puede pausar, adelantar o elegir la voz preferida.

Un elemento distintivo de la herramienta es la posibilidad de insertar botones de audio en partes específicas del documento, lo que facilita el acceso directo a fragmentos seleccionados sin recorrer todo el texto. Aunque esta función solo está habilitada en inglés por el momento, ha sido recibida con entusiasmo por plataformas especializadas, que remarcan su utilidad tanto para revisar textos como para mejorar la accesibilidad y profesionalizar presentaciones.

La integración de inteligencia artificial en Google Docs no se detiene ahí: la empresa ha potenciado la versión para Android del procesador de texto con la capacidad de generar imágenes directamente, ampliando así las posibilidades de enriquecer contenidos visuales. Estas mejoras dialogan con otras propuestas de la compañía, como NotebookLM —herramienta basada en IA para crear podcasts a partir de archivos y PDFs—, reflejando una estrategia de integración paulatina y enriquecimiento de la experiencia creativa.