OpenAI lanza un nuevo modelo de generación de imágenes: estas son sus novedades

La actualización introduce una interfaz creativa y nuevas herramientas que agilizan la transformación de ideas en imágenes digitales

La actualización mejora la fidelidad de las imágenes a las instrucciones ingresadas por los usuarios. (Reuters)

OpenAI ha anunciado el lanzamiento de GPT Image 1.5, su nuevo modelo de generación de imágenes, que ya está disponible para todos los usuarios de ChatGPT y a través de la API.

Esta actualización introduce mejoras en la capacidad de seguir instrucciones, una edición de imágenes más precisa y una velocidad de generación que puede ser hasta cuatro veces mayor que en versiones anteriores. El lanzamiento, que se produce esta semana, refuerza la apuesta de OpenAI por avanzar en el sector de la inteligencia artificial generativa, en un contexto de competencia creciente con Google.

La nueva versión de GPT Image destaca por su capacidad mejorada para interpretar y ejecutar instrucciones específicas, lo que permite a los usuarios obtener resultados más fieles a sus indicaciones.

Read more!
Las nuevas herramientas de edición permiten ajustes precisos en expresión, iluminación y color. (Reuters)

Además, incorpora herramientas de edición más precisas, que facilitan ajustes detallados en aspectos como la expresión facial, la iluminación, la composición y el tono de color, manteniendo la coherencia visual entre diferentes versiones de una misma imagen. Otro avance relevante es la velocidad de generación, que ahora puede ser hasta cuatro veces mayor, lo que agiliza el flujo de trabajo tanto para usuarios individuales como para profesionales.

“Estudio creativo” de ChatGPT

GPT Image 1.5 no solo introduce mejoras técnicas, sino que también redefine la experiencia de usuario. Fidji Simo, directora ejecutiva de aplicaciones de OpenAI, explicó que la nueva interfaz permite acceder a las imágenes generadas desde una barra lateral en ChatGPT, diseñada para funcionar como un “estudio creativo”.

Esta funcionalidad facilita la visualización y edición de imágenes, así como la exploración de tendencias y el uso de filtros predefinidos. Simo subrayó que las nuevas pantallas de visualización y edición simplifican la tarea de crear imágenes que se ajusten a la visión del usuario o sirvan de inspiración a partir de sugerencias populares.

El lanzamiento de GPT Image 1.5 responde a la competencia de Google y sus modelos Gemini 3 y Nano Banana Pro. (OpenAI)

Competencia con Google

El lanzamiento de GPT Image 1.5 se produce en un momento de intensa competencia con Google, que ha consolidado su posición en el sector tras el éxito de Gemini 3 y Nano Banana Pro, modelos que han liderado los principales rankings de rendimiento en LMArena. La respuesta de OpenAI, que incluyó el reciente lanzamiento de GPT-5.2, busca recuperar terreno frente a los avances de Google, especialmente en el ámbito de la generación de imágenes.

Al igual que Nano Banana Pro, la nueva versión de ChatGPT Image incorpora funciones de postproducción y controles de edición avanzados, abordando uno de los principales retos de las herramientas de IA generativa: la dificultad para mantener la coherencia visual durante las iteraciones.

Futuras mejoras

OpenAI planea seguir integrando elementos visuales en ChatGPT para enriquecer la experiencia de usuario. Entre los próximos objetivos figura la incorporación de más imágenes en las respuestas a consultas, con fuentes claras, lo que podría resultar útil en tareas como la conversión de medidas o la consulta de resultados deportivos.

OpenAI planea integrar más funciones visuales en ChatGPT para enriquecer la interacción y personalización. (Reuters)

Simo señaló que la visión de la compañía es acortar la distancia entre la imaginación del usuario y la capacidad de materializarla a través de la inteligencia artificial, facilitando así la creación y manipulación de contenido visual de manera intuitiva y eficiente.

La evolución de estas herramientas anticipa un escenario en el que la interacción con la inteligencia artificial será cada vez más visual y personalizada, permitiendo a los usuarios transformar sus ideas en imágenes con mayor facilidad y precisión.

Read more!