Por qué las imágenes de IA muestran menos colores que los que existen en el mundo real

Detrás de cada foto generada hay un ciclo de pérdidas cromáticas acumuladas que empieza mucho antes de que la inteligencia artificial entre en juego

Guardar
Google icon
Ilustración de un ojo humano que procesa un espectro de luz, seguido por un triángulo de gama de colores, un monitor digital y una cámara fotográfica.
Las imágenes digitales reproducen solo una fracción del espectro de color que capta la visión humana, limitando la percepción cromática original (Imagen Ilustrativa Infobae)

Las imágenes digitales no reproducen todo lo que percibe la visión humana, y esa diferencia puede ampliarse con la inteligencia artificial porque los modelos aprenden a partir de fotos ya limitadas por sensores, programas de edición, compresión de plataformas y espacios de color recortados, según explicó Douglas Goodwin, profesor en Diseño y Artes de los Medios, de la Universidad de California, en un artículo publicado en The Conversation.

Ese recorte no queda dentro del dispositivo. Las imágenes generadas por IA pueden circular por redes sociales y buscadores hasta sustituir a la referencia original, y cuando los modelos vuelven a entrenarse con material producido por modelos anteriores, sus resultados se estrechan con el tiempo y los colores menos frecuentes son los primeros en desaparecer.

PUBLICIDAD

La mayoría de las imágenes digitales corrientes siguen traducidas a sRGB, el espacio de color estándar creado para un ecosistema más antiguo de pantallas de tubo de rayos catódicos. Esa norma hizo predecible el color entre dispositivos, pero lo hizo a costa de una gama más estrecha de colores compartida por pantallas, cámaras y archivos, detalló el portal.

La consecuencia es que una imagen digital no registra lo mismo que ve el ojo. La pantalla ofrece una versión que parece completa, aunque en realidad entrega menos información cromática de la que la visión humana puede distinguir.

PUBLICIDAD

Infografía comparando la percepción de color humana con la reproducción limitada de cámaras, pantallas y IA, usando diagramas de ojo, cámara, monitor y cerebro con AI.
Esta infografía detalla cómo las imágenes digitales y los modelos de inteligencia artificial no reproducen el espectro completo de colores percibidos por la visión humana, limitando nuestra realidad visual (Imagen Ilustrativa Infobae)

Qué colores pierde la pantalla frente al ojo humano

Goodwin, que da clases sobre color en el Instituto de las Artes de California, explicó que cada sistema cromático conserva unas diferencias y excluye otras. En su descripción, la pantalla impone un límite silencioso: ordena el color según sus propias reglas y presenta ese resultado como si fuera total.

También relató que tiene deuteranomalía, una condición que no implica una pérdida simple de diferencias cromáticas, sino una reasignación de ellas, y citó investigaciones de 2005 de Cambridge que mostraron que observadores con esa condición pueden distinguir de forma fiable tonos caqui y oliva que a personas con visión cromática estándar les parecen idénticos. Esa experiencia le sirvió para comparar dos mapas incompletos: el del ojo y el de la pantalla; mientras su visión dejó inciertos algunos colores y afinó otros, la pantalla sacrifica amplitud a cambio de fiabilidad.

El artículo usa como ejemplo una planta pothos de neón. Su verde parece generar su propia luz, pero cuando se fotografía con un teléfono, la imagen “tiene sentido” sin reproducir el verde real: algunas tonalidades quedan aplanadas y otras aparecen reforzadas, como si el dispositivo intentara compensar lo que no puede mostrar.

La explicación técnica parte del sensor del teléfono. La luz rebota en la planta, alcanza el sensor y queda registrada como cifras; luego cada píxel se almacena como una combinación de rojo, verde y azul que indica a la pantalla cuánta luz de cada color primario debe emitir.

Diagrama de cromaticidad CIE en herradura con colores del espectro. Un triángulo blanco sRGB en su interior. Flechas de color apuntan hacia el triángulo.
La pantalla digital ofrece una representación incompleta de los colores, privando al usuario de matices que la visión natural sí distingue (Imagen Ilustrativa Infobae)

En la ciencia del color, los científicos representan la percepción humana como un campo con forma de herradura, mientras que un espacio de visualización estándar recorta un triángulo dentro de esa figura y deja fuera parte de lo que el ojo puede ver, porque los lados rectos del triángulo no siguen la curva de la herradura.

Aunque muchas pantallas modernas muestran más color que sRGB, ese formato sigue siendo el predeterminado de las imágenes digitales comunes porque funciona de forma fiable entre dispositivos y plataformas. El verde del pothos se remapea para encajar en ese espacio, y esa versión remapeada es la que termina viendo el usuario.

Cómo la IA amplifica el recorte de color en las imágenes

La IA no solo hereda esa brecha, sino que puede agrandarla. Los generadores de imágenes no se entrenan con la planta real que el usuario tiene delante, sino con millones de fotografías de plantas parecidas que ya pasaron por sensores, edición, compresión y límites cromáticos de pantalla, detalló Goodwin. En ese proceso, muchos verdes intensos ya fueron recortados o desplazados antes de llegar al modelo. El sistema aprende, entonces, sobre un archivo visual ya traducido y empobrecido en ciertas zonas del color.

El experto recurre a otro ejemplo para ilustrarlo: la pluma de pavo real. Si se le pide a un modelo generador de imágenes que produzca una, el resultado será probablemente una imagen competente con el ocelo canónico, pupila oscura, anillo cian, dorado y borde magenta, porque esos son colores y formas que el ecosistema digital sabe conservar; lo que falta es la iridiscencia.

Ilustración digital con un embudo. Imágenes vibrantes tipo polaroid entran por la izquierda, algunas raras se atascan, y menos imágenes desaturadas salen por la derecha.
Modelos de IA tienden a reforzar los patrones de color más frecuentes y suprimen saturaciones, destellos metálicos y reflejos estructurales menos comunes (Imagen Ilustrativa Infobae)

En una pluma real, las barbas —las ramificaciones que salen del eje central de la pluma— pueden destellar en azul, verde y bronce al cambiar el ángulo de la luz. Una fotografía fija ese brillo en una sola posición, y la imagen generada lo aplana aún más: las barbas se vuelven marrones y turbias, con apenas reflejos metálicos.

La razón está en cómo aprenden los modelos generativos. Estos producen imágenes a partir de los patrones más frecuentes de sus datos de entrenamiento y resuelven bien el brillo ordinario, pero dejan escapar los efectos menos comunes: colores saturados, destellos metálicos y reflejos estructurales.

Ese brillo puede seguir pareciendo espectacular, pero es un brillo nativo de pantalla. Se trata de una luminosidad aprendida de otras imágenes vistas en pantallas, no de la observación directa del objeto.

La consecuencia se extiende al hábito visual. Si una persona solo ve el ala de un escarabajo como una imagen apagada, nada le informa que existió una versión más intensa; si todas las fotos de una planta llegan con sus verdes amortiguados dentro del mismo rango seguro para pantalla, ese rango termina definiendo lo que esa persona entiende por verde.

Para detectar la diferencia, el texto propone mirar primero el objeto real: un caqui maduro, una pluma de pavo real o el naranja rosado en la base del cielo del desierto. Después, fotografiarlo y comparar ambas cosas lado a lado. Esa distancia entre el objeto y su imagen es la brecha que la pantalla excluye de su territorio.

PUBLICIDAD

PUBLICIDAD