DeepSeek lanza Janus Pro, un modelo generativo que crea imágenes "altamente realistas" y con gran detalle

Guardar

DeepSeek, la empresa china responsable del 'chatbot' del mismo nombre que ha desbancado a ChatGPT en la App Store, ha lanzado Janus Pro, un nuevo modelo de generación de imágenes que mejora la comprensión multimodal y la estabilidad de la generación de imagen a texto para ofrecer resultados "altamente realistas" y con detalle pese a su baja resolución.

Janus Pro es el último integrante de la familia de modelos generativos Janus, una versión mejorada que, como explica la compañía en el repositorio de GitHub, "incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño de modelo mayor".

En su base se encuentra el modelo de lenguaje visual DeepSeek VL2, con 4.500 millones de parámetros activados. Según la compañía, "logra un rendimiento competitivo o de última generación con parámetros activados similares o menores en comparación con los modelos densos y basados en MoE de código abierto existentes".

Janus Pro se ofrece en dos tamaños, con mil millones de parámetros (1B) y 7.000 millones de parámetros (7B). Este último ofrece una mejor comprensión multimodal y mejora la estabilidad de la generación de texto a imagen.

En concreto, en comprensión multimodal, sus creadores aseguran que supera a TokenFlow XL (13B), algo que atribuyen a "la disociación de la codificación visual para la comprensión y la generación multimodales, que mitiga el conflicto entre estas dos tareas".

En lo que respecta a la generación de texto a imagen, en los test GenEval y DPG-Bench, Janus Pro 7B muestra una precisión general del 80 por ciento en la primera evaluación, donde supera a Dall-E 3 (67%), como resultado de su enfoque para las capacidades de seguir instrucciones. En DPG-Bench alcanza una puntuación de 84.19.

DeepSeek también destaca la calidad de los resultados: imágenes "altamente realistas" que contienen gran detalle pese a la resolución de 384 x 384 píxeles, si bien esta baja resolución es todavía una limitación del modelo.

DeepSeek se ha popularizado este lunes después de que su 'chatbot, del mismo nombre, alcanzara el primer puesto en las descargas de aplicaciones gratuitas en la App Store. En su base se encuentra el DeepSeek V3, que ha sido entrenado con 2.048 GPU Nvidia H800 y un coste de 5,6 millones de dólares y ofrece un rendimiento similar o superior al de modelos de vanguardia, como Claude 3.5 Sonnet, Llama 3.1 40B y GPT 4o.

La firma china lanzó recientemente otra familia de modelos de razonamiento, DeepSeek-R1-Zero y DeepSeek-R1. Este último, y según la compañía, con capacidad para alcanzar "un rendimiento en tareas de razonamiento comparable a OpenAI o1".

Últimas Noticias

Justicia argentina investiga a jefe de Gabinete de Milei por enriquecimiento ilícito

La cadena CNN denuncia agresiones de militares israelíes a su equipo de reporteros en Cisjordania

Corresponsales de una televisora estadounidense fueron retenidos y golpeados durante una cobertura en una localidad palestina, mientras soldados israelíes admitieron cooperar con colonos y actuar fuera de la legalidad, según grabaciones compartidas públicamente por los afectados

DeepSeek lanza Janus Pro, un modelo generativo que crea imágenes "altamente realistas" y con gran detalle

DeepSeek presenta Janus Pro, un modelo innovador que supera a Dall-E 3 en generación de imágenes con un enfoque en la comprensión multimodal y resultados detallados en resoluciones limitadas

Últimas Noticias

Justicia argentina investiga a jefe de Gabinete de Milei por enriquecimiento ilícito

La cadena CNN denuncia agresiones de militares israelíes a su equipo de reporteros en Cisjordania

Corresponsales de una televisora estadounidense fueron retenidos y golpeados durante una cobertura en una localidad palestina, mientras soldados israelíes admitieron cooperar con colonos y actuar fuera de la legalidad, según grabaciones compartidas públicamente por los afectados

Jamaica recibirá 50 millones de dólares para la resiliencia climática de los agricultores

Vingegaard da otro recital en la Volta con el doblete en Queralt

El Supremo prohíbe volar drones cerca de la casa de Bolsonaro, en prisión domiciliaria

Temas Relacionados

Últimas Noticias

Justicia argentina investiga a jefe de Gabinete de Milei por enriquecimiento ilícito

La cadena CNN denuncia agresiones de militares israelíes a su equipo de reporteros en Cisjordania

Corresponsales de una televisora estadounidense fueron retenidos y golpeados durante una cobertura en una localidad palestina, mientras soldados israelíes admitieron cooperar con colonos y actuar fuera de la legalidad, según grabaciones compartidas públicamente por los afectados

Jamaica recibirá 50 millones de dólares para la resiliencia climática de los agricultores

Vingegaard da otro recital en la Volta con el doblete en Queralt

El Supremo prohíbe volar drones cerca de la casa de Bolsonaro, en prisión domiciliaria