
Apple ha presentado MGIE, una innovación en inteligencia artificial de uso libre que permite modificar imágenes mediante simples instrucciones escritas. Este avance se logró gracias al trabajo conjunto con la Universidad de California en Santa Bárbara.
El sistema de Apple se basa en lo que se llama “edición de imágenes guiada”. Esto significa que, por medio de tecnologías avanzadas capaces de entender texto e imágenes (conocidas como modelos de lenguaje grande multimodal), MGIE puede interpretar lo que una persona solicita y cambiar una imagen en detalle, pixel por pixel.
PUBLICIDAD
Por ejemplo, si el usuario le pide a la IA que “haga el cielo más azul” en una fotografía, MGIE entenderá esta instrucción y modificará la imagen para cumplir con el pedido.

Cómo trabaja MGIE
Los investigadores explican que a veces las instrucciones que las personas dan son muy cortas y directas, lo que dificulta su comprensión por los sistemas actuales.
PUBLICIDAD
No obstante, los modelos de lenguaje grande que entienden tanto texto como imágenes (MLLM) muestran gran potencial para interpretar y responder a estas instrucciones mediante la edición visual.
MGIE, el método desarrollado, trabaja de dos maneras con estos MLLM. Primero, toma las instrucciones escritas por el usuario y las traduce en comandos más detallados y específicos que facilitan la edición.
PUBLICIDAD
Por ejemplo, si alguien quiere que el pasto de una foto luzca más verde, MGIE podría entender esto como “aumentar un 20% la saturación de verde en el área correspondiente al pasto”. Este comando claro es el que se utiliza para editar la imagen.

Luego, en un segundo paso, usa estos modelos avanzados para generar una idea visual precisa de cómo debería verse la edición final.
Este proceso crea una guía para ajustar la imagen, modificando cada píxel según sea necesario. Así, MGIE puede realizar cambios específicos en instrucciones muy breves o ambiguas sin necesitar mucha información adicional y brindar resultados que satisfacen lo pedido por el usuario.
PUBLICIDAD
Según los creadores, este sistema mejora significativamente la precisión de las ediciones y la satisfacción de los usuarios, manteniendo un proceso rápido y eficiente.
Cómo probar MGIE
El más reciente modelo de IA de Apple, conocido como MGIE, ha sido compartido en GitHub, permitiendo el acceso público al código fuente, los datos utilizados para entrenar el algoritmo, versiones ya entrenadas y una guía para su uso en diferentes situaciones de edición.
PUBLICIDAD

Este paso hace que cualquier persona o desarrollador interesado pueda explorar y experimentar con esta tecnología.
Para quienes deseen probar MGIE sin sumergirse en detalles técnicos, se ha habilitado una demostración en línea en Hugging Face Spaces, una página web especializada en ofrecer pruebas de herramientas de inteligencia artificial.
PUBLICIDAD
Esto posibilita la integración de MGIE en aplicaciones existentes que necesiten editar imágenes o crear contenido visual de manera automática.
Esta apuesta por la inteligencia artificial marca una nueva era en la tecnología de consumo, donde herramientas como MGIE no solo impulsan la innovación, sino que también prometen transformar la manera en que los usuarios interactúan con sus dispositivos.
PUBLICIDAD

Aunque MGIE surge como un proyecto de investigación y aún no se ha anunciado su integración directa en productos o servicios de Apple, este lanzamiento subraya el interés de la compañía en fortalecer su posición en el campo de la inteligencia artificial.
Recientemente, Apple reveló MLX, otro algoritmo destinado a simplificar el diseño de modelos de aprendizaje automático.
La importancia que Apple le da a la inteligencia artificial quedó clara con las declaraciones de Tim Cook, su CEO, quien mencionó que están desarrollando nuevas capacidades de IA generativa que se esperan introducir a lo largo del año.
PUBLICIDAD
Expertos prevén que estas innovaciones se integrarán en iOS 18, marcando una evolución significativa para Siri, el asistente virtual de la empresa.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Una taza de café vacía y una cafetera sin café: así iniciaron las transmisiones En Vivo y el mundo streaming
Con el video online, el acceso móvil masivo y la expansión de plataformas sociales, el directo se volvió parte de la vida cotidiana, pero su origen se remonta a una cámara en blanco y negro en un laboratorio de Cambridge

Así lucirían Las Guerreras K-pop si fueran personajes de Jujutsu Kaisen, según la IA
Gemini permite adaptar a las protagonistas de la película surcoreana al estilo del popular anime a través de simples pasos y en pocos segundos

Tus problemas de sueño y animo tienen solución: este videojuego ayuda a combatir síntomas de depresión
El videojuego de Nintendo puede complementar el tratamiento de salud mental, pero no reemplazar la atención médica

Cómo saber quién llama y cómo activar la protección contra publicidad en celular Android
Google integra en su app de Teléfono un sistema que muestra quién llama, marca números sospechosos y permite filtrar llamadas no deseadas

Publicar el certificado de elecciones presidenciales en WhatsApp aumenta el riesgo de suplantación de identidad
El documento integra datos como el número de cédula y la ubicación de votación que pueden ser utilizados por ciberdelincuentes para fraudes



