Apple publica una base de datos con 400.000 imágenes de alta calidad para entrenar modelos de IA

El nuevo conjunto llamado Pico-Banana-400K, distribuido por la compañía, incluye fotografías con amplia variedad y diferentes tipos de edición, y busca impulsar avances en inteligencia artificial disponible para investigadores mediante acceso público a través de GitHub

Guardar

La creación de la base de datos Pico-Banana-400K se apoyó en el uso de la herramienta Nano Banana (Gemini 2.5 Flash Image), una tecnología que permitió a Apple conformar un conjunto diverso a partir de fotografías provenientes de OpenImages, generando múltiples pares de edición para cada imagen. De acuerdo con información publicada por el medio, el conjunto, compuesto por 400.000 imágenes de alta calidad, se encuentra disponible para la comunidad investigadora en la plataforma GitHub con una licencia de uso restringida al ámbito no comercial. La noticia principal radica en que Apple ha desarrollado y puesto a disposición pública una colección masiva y diversa de imágenes destinadas a entrenar modelos de inteligencia artificial enfocados en la generación de imágenes.

Según detalló el medio, este repositorio ha sido confeccionado poniendo especial atención tanto en la calidad visual de las fotografías como en su diversidad, criterios fundamentales para el desarrollo de modelos de inteligencia artificial que requieren grandes volúmenes de datos realistas y variados. El acceso a Pico-Banana-400K, explicaron los responsables del proyecto en GitHub, está orientado a facilitar y potenciar la investigación académica, contribuyendo con recursos que hasta ahora escaseaban debido a la falta de conjuntos de imágenes a gran escala, abiertos y generados a partir de material real.

El medio precisó que las imágenes incluidas en el conjunto cubren 35 tipos diferentes de edición organizados en ocho categorías semánticas. Estas categorías están diseñadas para representar un espectro amplio de transformaciones, desde simples ajustes en el color o la luminosidad hasta ediciones complejas que afectan a objetos de alto nivel, escenas completas y atributos estilísticos. Tal como se expone en el repositorio de GitHub, estas transformaciones pretenden simular intervenciones diversas que suelen aplicarse en los procesos de edición y generación de imágenes utilizadas en la inteligencia artificial moderna.

Pico-Banana-400K tiene como objetivo principal servir de herramienta para el entrenamiento de modelos de generación de imágenes guiados por texto, lo que implica la posibilidad de crear imágenes originales a partir de descripciones verbales. La base de datos responde a limitaciones identificadas por la investigación adjunta, publicada en ArXiv, referidas a la escasez de datos a gran escala que sean tanto de alta calidad como accesibles para la comunidad de investigación. La propuesta de Apple busca solventar la carencia de recursos que posibiliten la mejora de modelos entrenados en la comprensión y generación de imágenes complejas partiendo de instrucciones textuales.

El repositorio publicado en GitHub, según reportó el medio, resalta que el acceso a estos datos está sujeto a una licencia que prohíbe su uso comercial, enfocado exclusivamente a la investigación. El desarrollo de Pico-Banana-400K, especificó la plataforma, incluyó la selección cuidadosa de imágenes reales y la aplicación de ediciones controladas, todo documentado detalladamente en la publicación académica disponible en ArXiv, que explica las metodologías y los objetivos perseguidos en el proyecto.

La iniciativa responde a la tendencia creciente en la industria tecnológica de ofrecer conjuntos de datos abiertos para acelerar el avance de la inteligencia artificial, en particular la generación de imágenes, un campo que depende de grandes volúmenes de referencias visuales diversas y bien clasificadas. El medio subrayó que Pico-Banana-400K pretende beneficiar tanto el desarrollo de modelos novedosos como la evaluación objetiva de algoritmos existentes, proporcionando un estándar de referencia de acceso libre para la comunidad científica.

Además, el conjunto incorpora diferentes grados de edición, desde modificaciones sutiles en el color hasta transformaciones que alteran significativamente el contenido de la imagen, lo que lo hace útil para investigaciones que requieren analizar la capacidad de los modelos de IA para entender la coherencia visual y los matices estilísticos. La diversidad de ediciones y categorías semánticas incluidas ha sido determinada para contemplar distintos usos potenciales en la investigación, como la generación condicionada, la transferencia de estilo visual y la manipulación controlada de escenas.

En conclusión, según informó el medio, la publicación de Pico-Banana-400K refuerza el interés de Apple en aportar herramientas de utilidad pública enfocadas en la investigación en inteligencia artificial. Facilitar el acceso abierto a grandes colecciones de datos de alta calidad se presenta como un factor esencial para contribuir al desarrollo y mejora de modelos de generación de imágenes cada vez más precisos, flexibles y capaces de responder a las demandas de la investigación científica internacional.

Últimas Noticias

Marcelino García Toral: "Nuestra situación es complicada por la falta de efectivos, no por los resultados"

El entrenador del Villarreal destacó que el equipo atraviesa un momento difícil por las numerosas bajas antes de medirse con el Barcelona, aseguró que el grupo mantiene una actitud positiva y confía en mejorar en la segunda parte del torneo

Marcelino García Toral: "Nuestra situación

La IPC suspende el estado de hambruna en Gaza pero avisa que la gravedad de la crisis es extrema

Miles de personas en el enclave palestino permanecen bajo amenaza de desnutrición severa pese al alivio temporal brindado por la entrada de asistencia internacional, advierten especialistas, quienes subrayan el alto riesgo ante cualquier interrupción de suministros y servicios básicos

La IPC suspende el estado

Bruselas reintroducirá gradualmente los visados a Georgia si persisten violaciones de derechos fundamentales

La Unión Europea anuncia que comenzará a restringir el ingreso sin visado a funcionarios georgianos ante reiterados incumplimientos sobre derechos y libertades, mientras insiste en la urgencia de corregir la situación antes del cambio en el sistema comunitario

Bruselas reintroducirá gradualmente los visados

La FINUL entrega a Líbano el primer campo minado despejado desde los enfrentamientos de Israel y Hezbolá

El organismo de paz de la ONU entregó a las autoridades locales una zona limpia de artefactos explosivos tras una pausa en el conflicto, tras hallar casi 400 minas y concluir labores humanitarias iniciadas en agosto en la frontera

La FINUL entrega a Líbano

El Senado confirma a casi un centenar de nuevos nominados de Trump para un total de 417 desde principios de año

Con una amplia mayoría republicana, la cámara alta estadounidense aprobó 97 designaciones presidenciales en una sola sesión, superando el ritmo de administraciones anteriores y consolidando la influencia de Donald Trump en puestos estratégicos del gobierno federal

El Senado confirma a casi