Cómo funciona la IA que detecta imágenes falsas con solo tres minutos de entrenamiento

SimLBR fue presentado en la IEEE/CVF Conference on Computer Vision and Pattern Recognition. El sistema, desarrollado por investigadores de la Washington University in St. Louis, convierte cada foto en un vector de 1.024 dimensiones y clasifica como sintético todo lo que se aleja de la distribución real

Google icon
SimLBR, un modelo de inteligencia artificial que detecta imágenes falsas a partir del aprendizaje de fotos auténticas (Imagen Ilustrativa Infobae)

Un equipo de la Washington University in St. Louis presentó SimLBR, un modelo de inteligencia artificial que detecta imágenes falsas a partir del aprendizaje de qué fotos son auténticas, una estrategia pensada para enfrentar una carrera tecnológica en la que los generadores sintéticos mejoran hasta el punto de que en el futuro podría resultar imposible para una persona distinguir una imagen auténtica de una fabricada, informó el portal tecnológico TechXplore.

El sistema necesita menos de tres minutos de entrenamiento en una sola GPU, frente a las dos horas en ocho GPU que requiere el método más avanzado disponible, una diferencia que supone una ventaja computacional “significativa” y reduce el costo del proceso, explicó Aayush Dhakal, estudiante de doctorado en el laboratorio de Nathan Jacobs, profesor de ciencias de la computación e ingeniería en la McKelvey School of Engineering de la Washington University in St. Louis.

El investigador, junto con colaboradores del Oak Ridge National Laboratory, presentó el modelo en la IEEE/CVF Conference on Computer Vision and Pattern Recognition, y los resultados fueron publicados en el servidor de prepublicaciones arXiv.

PUBLICIDAD

Investigadores de la Washington University in St. Louis presentan SimLBR, un modelo de IA que detecta imágenes falsas aprendiendo qué fotos son auténticas de forma rápida y eficiente. (Imagen Ilustrativa Infobae)

Cómo funciona SimLBR

La diferencia central del enfoque está en que opera en el llamado espacio latente. Eso significa que el sistema proyecta píxeles de muy alta dimensionalidad hacia una representación más reducida mediante un modelo fundacional.

A partir de ese proceso, las imágenes se convierten en un vector de 1.024 dimensiones, y el aprendizaje ocurre solo dentro de ese espacio. El objetivo es evitar el costo de entrenar sobre la totalidad de los píxeles de una imagen.

La propuesta parte de un cambio de lógica: en vez de perseguir los rasgos específicos de cada nueva generación de imágenes falsas, el modelo intenta anclar su criterio en la distribución real. De acuerdo con el portal, esa decisión busca resolver un problema práctico: los detectores entrenados sobre falsificaciones previas quedan rezagados cuando aparece un generador nuevo.

PUBLICIDAD

La infografía explica el modelo SimLBR, un detector de imágenes falsas impulsado por IA que prioriza el contenido real, su proceso de funcionamiento y los beneficios de su novedosa estrategia. (Imagen Ilustrativa Infobae)

El problema de detectar imágenes falsas con IA

Dhakal sostuvo que concentrarse en detectar imágenes falsas deja al usuario un paso por detrás, porque la tecnología cambia cada vez que los generadores reciben mejoras. En su planteo, el problema no es solo la calidad de las imágenes, sino la velocidad con la que cambia su origen.

El investigador explicó: “Cuando se lanza un nuevo modelo generado por IA, no tendrás acceso a las imágenes que creó previamente. Una vez que tienes ese acceso, puedes entrenar el modelo, pero cuando las imágenes de ese modelo aparecen en las redes sociales o en internet, el detector no las ha visto y no va a poder clasificarlas bien”.

El modelo proyecta las imágenes a un vector de 1.024 dimensiones mediante un modelo fundacional para procesar una representación más reducida (Imagen Ilustrativa Infobae)

Para medir si un detector puede sostener su desempeño frente a falsificaciones futuras, el equipo diseñó dos métricas: fiabilidad y rendimiento en el peor caso. Una puntuación alta de fiabilidad indica que el detector combina alta precisión con baja incertidumbre, lo que permite estimar con qué nivel de confianza funcionará frente a nuevos generadores de IA.

El rendimiento en el peor caso representa el desempeño esperable cuando el detector se enfrenta a un generador futuro que se aparta de aquello con lo que fue entrenado. Esa métrica apunta a un escenario más exigente: no evaluar solo si el sistema acierta hoy, sino cuánto puede resistir cuando cambian las reglas del problema.

Dhakal sintetizó ese criterio con una definición centrada en la distancia respecto de la realidad: “Cada vez que las cosas se desvían lo suficiente de la distribución real, entonces las vamos a clasificar como falsas”. Esa decisión mejora el detector porque el modelo no busca patrones específicos de un generador en particular, sino que reconoce cuándo una imagen se aleja de lo que el mundo real suele producir. “No estamos buscando patrones muy específicos de un modelo generativo”, precisó.