Hugging Face reconstruirá el modelo DeepSeek-R1 para responder las dudas que deja sobre los datos y el entrenamiento

Hugging Face lanza Open-R1 para esclarecer aspectos del modelo DeepSeek-R1, enfocándose en la reconstrucción de datos y el proceso de entrenamiento no divulgado por la compañía china DeepSeek

Guardar

Hugging Face planea responder a las dudas que genera el modelo de razonamiento DeepSeek-R1 con una reconstrucción de los datos y el trabajo de entrenamiento en una iniciativa que han denominado Open-R1.

DeepSeek-R1 forma parte de la nueva familia de modelos de razonamiento que la empresa china DeepSeek ha lanzado recientemente. Construido a partir de DeepSeek V3 y bajo un proceso de aprendizaje de refuerzo puro, alcanza un rendimiento en tareas de razonamiento comparable a OpenAI o1.

O al menos eso es lo que asegura la compañía en los papeles técnicos que ha compartido sobre el modelo de razonamiento. Sin embargo, aunque quedan detalles por saber, como los conjuntos de datos que se han utilizado, el código de entrenamiento y las leyes de escala, que permiten ver las compensaciones entre computación y datos en el entrenamiento.

Para responder a estas incógnitas, desarrolladores de Hugging Face han anunciado la iniciativa Open-R1. "El lanzamiento de DeepSeek-R1 es un gran beneficio para la comunidad, pero no publicaron todo: aunque los pesos del modelo están abiertos, los conjuntos de datos y el código utilizado para entrenar el modelo no lo están", explican en el blog oficial de Hugging Face.

El objetivo de esta iniciativa es "construir estas últimas piezas que faltan para que toda la comunidad de investigación e industria pueda construir modelos similares o mejores utilizando estas recetas y conjuntos de datos".

Últimas Noticias

Pakistán anuncia una "pausa temporal" de los ataques contra Afganistán por el fin del Ramadán

El gobierno toma esta medida durante el Eid al Fitr por solicitud de Arabia Saudí, Qatar y Turquía, tras semanas de intensos combates que han dejado decenas de víctimas y miles de desplazados, según Naciones Unidas

Pakistán anuncia una "pausa temporal"

Trump suspende 60 días la centenaria Ley Jones para abaratar el transporte de petróleo entre puertos de EEUU

Washington autoriza que buques foráneos transporten insumos clave a lo largo del país durante dos meses, permitiendo el ingreso de petróleo, gas y carbón para hacer frente a la escalada de los costos energéticos, según la Casa Blanca

Trump suspende 60 días la

Openbank supera el millón de clientes en México

La filial digital de Santander celebra un año en territorio mexicano con un crecimiento récord, multiplicando usuarios y elevando el volumen de operaciones, mientras anuncia nuevas soluciones enfocadas en innovación, accesibilidad y una oferta sin comisiones

Openbank supera el millón de

Microsoft desarrolla una tecnología de comunicación con MicroLED de bajo coste para los centros de datos

La compañía revela una innovación en transmisión de datos junto a MediaTek y otros proveedores, buscando duplicar la eficiencia energética, reducir dimensiones y sustituir sistemas tradicionales, mientras impulsa soluciones de fibra óptica avanzada en su infraestructura global

Microsoft desarrolla una tecnología de

Líbano denuncia que Israel rechaza negociaciones para un alto el fuego

El ministro de Cultura, Ghassan Salamé, afirmó en Al Jazeera que el diálogo entre ambos gobiernos está paralizado, advirtiendo sobre la falta de avances y el papel clave de países europeos para destrabar la crisis diplomática regional

Líbano denuncia que Israel rechaza