DeepSeek bajo la lupa: habrían usado datos de Google Gemini para entrenar a la IA

Guardar

Las sospechas sobre DeepSeek reavivan el debate ético y legal sobre el uso de datos en inteligencia artificial. (REUTERS/Dado Ruvic/Illustration/File Photo)

Una gran sospecha recae sobre el laboratorio que entrenó a DeepSeek, una inteligencia artificial. Tras el lanzamiento del último modelo, se ha especulado del posible uso de datos de Google Gemini para su funcionamiento.

Esta tecnología ha llamado la atención por su capacidad para resolver problemas complejos de matemáticas y programación, pero ahora todo todas las miradas apuntan a la implementación de información de una IA que pertenece a otra compañía.

La polémica gira en torno a la especulación de que DeepSeek podría haber utilizado datos del modelo Gemini 2.5 Pro de Google para entrenar su último modelo. Aunque la empresa no ha revelado las fuentes específicas de los datos, varias señales han levantado dudas razonables entre los investigadores del sector.

El desarrollador australiano Sam Paech, conocido por sus evaluaciones de inteligencia emocional, ha sido uno de los primeros en detectar similitudes en el lenguaje y las expresiones utilizadas por R1-0528, comparables a las preferidas por Gemini.

Investigadores sospechan que DeepSeek utilizó datos del modelo Gemini de Google para entrenar su último desarrollo de IA. (Google)

Según expuso en una publicación en X, la preferencia de términos y estructuras gramaticales en el modelo de DeepSeek se asemeja notablemente a aquellos de Gemini.

A estas afirmaciones se unen las observaciones del creador anónimo de SpeechMap, una herramienta que evalúa la libertad de expresión en modelos de IA. Este desarrollador notó que las “trazas” o pasos intermedios generados por R1-0528 a medida que avanza hacia una conclusión, guardan similitudes con las generadas por Gemini.

Estas coincidencias plantean preguntas sobre si DeepSeek ha recurrido a estos datos externos, lo que desencadenaría implicaciones tanto éticas como legales.

No es la primera vez que DeepSeek se enfrenta a acusaciones de entrenar modelos con datos de sus competidores. En diciembre de 2024, llamó la atención cuando su modelo V3 se identificó erróneamente como ChatGPT, lo que sugirió un posible entrenamiento con registros de conversaciones de la plataforma de OpenAI.

Similitudes lingüísticas entre DeepSeek y Gemini destacan en el lenguaje y las estructuras utilizadas por sus modelos. (Imagen Ilustrativa Infobae)

Este tipo de acciones generan inquietud en términos de competencia y ponen en cuestión el respeto a los términos de servicio de las empresas desarrolladoras de IA.

OpenAI ha señalado previamente que detectó prácticas de destilación empleadas por DeepSeek, una técnica que, si bien es común y legal en muchos casos, puede infringir normativas si se usan outputs de modelos de empresas rivales para entrenar productos competidores.

Esta técnica permite generar modelos más pequeños utilizando datos de modelos más grandes y avanzados, una práctica que OpenAI explícitamente prohíbe con sus resultados.

El contexto de estas sospechas se ve agravado por el fenómeno de la “contaminación de datos”. En la actualidad, la web abierta está cada vez más saturada de contenido generado por IA, lo cual dificulta la identificación de datos limpios y precisos para el entrenamiento de nuevos modelos.

DeepSeek enfrenta acusaciones previas de copiar outputs de modelos rivales, como ocurrió con OpenAI. (Imagen Ilustrativa Infobae)

Plataformas como Reddit y redes sociales inundan la web con contenido generado automáticamente con fines comerciales, afectando la calidad de las bases de datos.

Este entorno altamente contaminado facilita una convergencia en los resultados lingüísticos y estilísticos entre diversos modelos, complicando determinar si una similitud se debe a una copia intencional o simplemente es una coincidencia estadística resultante del uso de datos de la web.

Las acusaciones contra DeepSeek abren un debate crucial en torno a la ética y la propiedad intelectual en el ámbito de la IA. Si se comprobara que la IA china ha utilizado datos de Google Gemini, se plantearían serias cuestiones sobre la equidad y competencia en el mercado tecnológico.

Además, el uso indebido de datos podría tener graves repercusiones legales y comerciales, afectando significativamente a la empresa implicada.

Implicaciones legales y comerciales amenazan a DeepSeek si se confirma la vinculación con datos de Gemini. (Imagen Ilustrativa Infobae)

Para prevenir este tipo de situaciones, las compañías líderes en el sector han comenzado a reforzar sus medidas de seguridad. OpenAI ha implementado un proceso de verificación de identidad para acceder a sus modelos avanzados, excluyendo automáticamente a empresas de países que no cumplen con sus requisitos, como China.

Google, por su parte, ha optado por resumir las trazas generadas por sus modelos a través de AI Studio, limitando así la posibilidad de entrenar modelos competidores basados en estos datos.

Últimas Noticias

5 señales claras para saber si alguien hackeó tu Facebook

Problemas de acceso, notificaciones de inicio de sesión desconocido y actividad extraña son alertas de posible intruso

Evita que tu Smart TV se cuelgue: así debes conectarla correctamente a internet

La calidad de la conexión a internet es clave para evitar interrupciones en el uso de aplicaciones y streaming en Smart TV

WhatsApp en modo seguro: verificación de dos pasos y más trucos para blindar la cuenta de fraudes

Entre los riesgos de que ciberdelincuentes accedan a los datos privados almacenados en la aplicación se encuentra la suplantación de identidad

Cambios en Microsoft: la empresa reestructura su área de inteligencia artificial enfocada en Copilot

Jacob Andreou asumirá el liderazgo del desarrollo de productos, mientras Mustafa Suleyman se enfocará en modelos de IA

¿Qué hay tras la puerta de nivel 999?, la leyenda de Tibia, el juego de rol online que cobró 5.000 dólares por un secreto

El caso revela cómo los mitos digitales dan forma a la cultura gamer, generando economía, alianzas y experiencias únicas que mantienen vivo el espíritu del juego a lo largo de generaciones

DeepSeek bajo la lupa: habrían usado datos de Google Gemini para entrenar a la IA

Esta no es la primera vez que este sistema genera sospechas sobre su funcionamiento. Ya hay otro antecedente con ChatGPT

Por qué se especula que DeepSeek uso Gemini para su entrenamiento

Prácticas cuestionables detrás de DeepSeek

Contaminación de datos: el gran desafío

Cuáles serían las implicaciones del uso de datos de Gemini en DeepSeek

Últimas Noticias

5 señales claras para saber si alguien hackeó tu Facebook

Problemas de acceso, notificaciones de inicio de sesión desconocido y actividad extraña son alertas de posible intruso

Evita que tu Smart TV se cuelgue: así debes conectarla correctamente a internet

La calidad de la conexión a internet es clave para evitar interrupciones en el uso de aplicaciones y streaming en Smart TV

WhatsApp en modo seguro: verificación de dos pasos y más trucos para blindar la cuenta de fraudes

Entre los riesgos de que ciberdelincuentes accedan a los datos privados almacenados en la aplicación se encuentra la suplantación de identidad

Cambios en Microsoft: la empresa reestructura su área de inteligencia artificial enfocada en Copilot

Jacob Andreou asumirá el liderazgo del desarrollo de productos, mientras Mustafa Suleyman se enfocará en modelos de IA

¿Qué hay tras la puerta de nivel 999?, la leyenda de Tibia, el juego de rol online que cobró 5.000 dólares por un secreto

El caso revela cómo los mitos digitales dan forma a la cultura gamer, generando economía, alianzas y experiencias únicas que mantienen vivo el espíritu del juego a lo largo de generaciones

Lionel Scaloni dio a conocer la última lista de la selección argentina antes del Mundial 2026 con varias sorpresas

Boca Juniors cambió su escudo en las redes sociales: la explicación sobre una decisión que generó debate

La lista de cuatro candidatos que tiene en carpeta San Lorenzo para reemplazar a Damián Ayude como DT

El Inter Miami de Lionel Messi buscará el pase a los cuartos de final de la Concachampions ante Nashville SC: hora, TV y formaciones

La preocupación del Chelsea por el efecto dominó que podría desencadenar la hipotética salida de Enzo Fernández

Catherine Fulop se sinceró sobre su rol como abuela de Gia: “Hoy se cría a los hijos de otra manera”

La palabra de Roberto Pettinato sobre el juicio que enfrenta Felipe: “Tenemos una condena social”

Juana Viale y Luciano Cáceres sorprenden con un proyecto juntos: cómo será el filme que indaga el universo swinger

María Fernanda Callejón habló tras el cruce con Cinthia Fernández: “Fue absolutamente vergonzante”

Abrazos, promesas y dedicatorias: así festejaron Ian Lucas y La Reini el paso a la final de MasterChef Celebrity

INFOBAE AMÉRICA

Operativo militar en área natural protegida de Ecuador destruyó campamentos de minería ilegal

Cuba, Spotify, libertad y salud mental: las opiniones de Joan Manuel Serrat en Mendoza

Al menos ocho muertos en una acción policial antidrogas en favelas de Río de Janeiro

Una reconocida automotriz retira más de 48.000 autos por riesgo de incendio en el motor por cableado defectuoso

Una ola de calor histórica en el suroeste de Estados Unidos rompe récords y afecta a millones de personas

Por qué se especula que DeepSeek uso Gemini para su entrenamiento

Prácticas cuestionables detrás de DeepSeek

Contaminación de datos: el gran desafío

Cuáles serían las implicaciones del uso de datos de Gemini en DeepSeek

Temas Relacionados

Últimas Noticias

5 señales claras para saber si alguien hackeó tu Facebook

Problemas de acceso, notificaciones de inicio de sesión desconocido y actividad extraña son alertas de posible intruso

Evita que tu Smart TV se cuelgue: así debes conectarla correctamente a internet

La calidad de la conexión a internet es clave para evitar interrupciones en el uso de aplicaciones y streaming en Smart TV

WhatsApp en modo seguro: verificación de dos pasos y más trucos para blindar la cuenta de fraudes

Entre los riesgos de que ciberdelincuentes accedan a los datos privados almacenados en la aplicación se encuentra la suplantación de identidad

Cambios en Microsoft: la empresa reestructura su área de inteligencia artificial enfocada en Copilot

Jacob Andreou asumirá el liderazgo del desarrollo de productos, mientras Mustafa Suleyman se enfocará en modelos de IA

¿Qué hay tras la puerta de nivel 999?, la leyenda de Tibia, el juego de rol online que cobró 5.000 dólares por un secreto

El caso revela cómo los mitos digitales dan forma a la cultura gamer, generando economía, alianzas y experiencias únicas que mantienen vivo el espíritu del juego a lo largo de generaciones

Lionel Scaloni dio a conocer la última lista de la selección argentina antes del Mundial 2026 con varias sorpresas

Boca Juniors cambió su escudo en las redes sociales: la explicación sobre una decisión que generó debate

La lista de cuatro candidatos que tiene en carpeta San Lorenzo para reemplazar a Damián Ayude como DT

El Inter Miami de Lionel Messi buscará el pase a los cuartos de final de la Concachampions ante Nashville SC: hora, TV y formaciones

La preocupación del Chelsea por el efecto dominó que podría desencadenar la hipotética salida de Enzo Fernández

Catherine Fulop se sinceró sobre su rol como abuela de Gia: “Hoy se cría a los hijos de otra manera”

La palabra de Roberto Pettinato sobre el juicio que enfrenta Felipe: “Tenemos una condena social”

Juana Viale y Luciano Cáceres sorprenden con un proyecto juntos: cómo será el filme que indaga el universo swinger

María Fernanda Callejón habló tras el cruce con Cinthia Fernández: “Fue absolutamente vergonzante”

Abrazos, promesas y dedicatorias: así festejaron Ian Lucas y La Reini el paso a la final de MasterChef Celebrity

INFOBAE AMÉRICA

Operativo militar en área natural protegida de Ecuador destruyó campamentos de minería ilegal

Cuba, Spotify, libertad y salud mental: las opiniones de Joan Manuel Serrat en Mendoza

Al menos ocho muertos en una acción policial antidrogas en favelas de Río de Janeiro

Una reconocida automotriz retira más de 48.000 autos por riesgo de incendio en el motor por cableado defectuoso

Una ola de calor histórica en el suroeste de Estados Unidos rompe récords y afecta a millones de personas