
Elon Musk, fundador de xAI, comparte la inquietud de otros líderes del sector al advertir que los datos del mundo real disponibles para entrenar modelos de inteligencia artificial están llegando a su límite. Esta escasez plantea nuevos retos y obliga a explorar alternativas, como el uso de datos sintéticos, para seguir impulsando los desarrollos en el campo.
El agotamiento de los datos reales y el auge de los datos sintéticos en IA
Durante una transmisión en directo junto a Mark Penn, presidente de Stagwell, en X, Elon Musk afirmó: “Ya hemos agotado prácticamente todo el conocimiento humano acumulado... en el entrenamiento de IA”.
PUBLICIDAD
Asegura que este fenómeno se produjo “prácticamente el año pasado”, lo que coincide con la advertencia de Ilya Sutskever, exdirector científico de OpenAI, quien en la conferencia NeurIPS habló del “pico de datos” y la necesidad de cambiar la estrategia de desarrollo de modelos.

Frente a la escasez de datos reales, Musk sostiene que “la única manera de complementar [los datos del mundo real] es con datos sintéticos, donde la IA crea [datos de entrenamiento]”.
PUBLICIDAD
Este enfoque implica que los propios modelos de inteligencia artificial generen información para su autoaprendizaje, pasando por procesos de autocalificación y mejora continua.
Grandes tecnológicas y el entrenamiento con datos generados por IA
Empresas como Microsoft, Meta, OpenAI y Anthropic ya están utilizando datos sintéticos para el entrenamiento de sus modelos más avanzados. Según estimaciones de Gartner, en 2024 el 60% de los datos empleados en proyectos de IA y análisis fueron generados sintéticamente.
PUBLICIDAD

Casos concretos ilustran esta tendencia: el modelo Phi-4 de Microsoft, publicado como código abierto en 2025, se entrenó combinando datos reales y sintéticos. Google adoptó la misma estrategia con sus modelos Gemma.
Anthropic recurrió a datos generados por IA para crear Claude 3.5 Sonnet, mientras que Meta utilizó este tipo de información para perfeccionar su serie Llama.
PUBLICIDAD
Un beneficio adicional del uso de datos sintéticos es el ahorro de costes; por ejemplo, el modelo Palmyra X 004 de la startup Writer se desarrolló casi exclusivamente con fuentes sintéticas, reduciendo los costes a USD 700.000 frente a los USD 4,6 millones estimados para un modelo de tamaño similar entrenado con datos reales.
Ventajas y riesgos de los datos sintéticos para entrenar inteligencia artificial
Si bien el entrenamiento con datos sintéticos permite sortear la falta de información y reducir gastos, también conlleva riesgos. Investigaciones recientes advierten que el uso excesivo de datos generados por IA puede provocar el “colapso del modelo”, un fenómeno en el que la IA se vuelve menos creativa y más proclive a reproducir sesgos, limitando su utilidad y capacidad para resolver problemas diversos.
PUBLICIDAD

Los sesgos y limitaciones presentes en los datos sintéticos pueden transferirse a los modelos, comprometiendo su funcionalidad en tareas reales.
Así, la industria de la inteligencia artificial enfrenta el desafío de equilibrar el uso de datos sintéticos para mantener el avance tecnológico sin sacrificar la calidad, diversidad y creatividad en los resultados.
PUBLICIDAD
Elon Musk alerta sobre la desaparición de una profesión
En una reunión interna de xAI y durante sus intervenciones en el Foro Económico Mundial de Davos 2026, Elon Musk propuso un giro radical en la discusión sobre el futuro laboral en la era digital.
Según Musk, para finales de 2026, la programación tradicional dejará de ser una preocupación, ya que la inteligencia artificial alcanzará un nivel de desarrollo tal que el trabajo será solo una opción y no una necesidad.
PUBLICIDAD
Musk anticipa que, en ese escenario, los programadores ya no tendrán que escribir código línea por línea. Bastará con describir lo que se quiere lograr a un chatbot, que se encargará de generar automáticamente los archivos ejecutables necesarios.
El empresario considera que el cambio será tan profundo que, hacia finales de este año, la programación manual resultará obsoleta gracias a la capacidad de los modelos de IA para interpretar instrucciones en lenguaje natural y producir soluciones listas para usar.
PUBLICIDAD
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
¿Un Bluetooth fantasma? Por qué un vuelo de United a Mallorca tuvo que dar la vuelta en mitad del Atlántico
Se estableció que el dispositivo en cuestión era una pulsera inteligente que pertenecía a una joven de 16 años que viajaba en la aeronave

Qué debes conectar de último para evitar daños: el celular o el cargador
Una complicación potencial se relaciona con los picos de corriente, especialmente si el cargador presenta fallas o es de baja calidad

El peligro mortal de las citas a ciegas por internet y cómo protegerte
Casos como la muerte de una madre en Perú muestran que encuentros presenciales con personas conocidas en redes sociales o apps pueden ser fatales si se ignoran las alertas

Cómo reutilizar tu antiguo teléfono y darle nueva vida como consola retro o cámara de seguridad
La tendencia convierte teléfonos en desuso en herramientas de entretenimiento y vigilancia con emuladores, una alternativa que reduce gasto, extiende la vida útil del equipo



