El modelo Grok 3 se apoya en el buscador Deep Search y promete superar a GPT-4o con razonamiento a nivel de doctorado

Guardar

Miembros de la división de Inteligencia Artificial (IA) de X, xAI, y el propietario de la plataforma, Elon Musk, han dado a conocer su nueva familia de modelos de lenguaje Grok 3, que se apoyará en el buscador Deep Search y promete superar a GPT-4o de OpenAI en los tests AIME y GPQA para el razonamiento a nivel de doctorado.

La presentación del nuevo modelo de IA de X ha tenido lugar este lunes, en una retransmisión que ha durado alrededor de una hora y en la que se ha explicado al destalle la considerada "IA más inteligente del planeta", en palabras del propietario de la plataforma, Elon Musk.

Esta versión mejorada de Grok 2 incluye las características de su predecesor, con mejoras en apartados como el chat o el razonamiento, así como la generación de imágenes; y suma otras, como la capacidad de reflexionar sobre los errores que comete, con el fin de lograr una coherencia lógica.

La división de inteligencia artificial de X también ha señalado que planeaba lanzar Grok 3 en 2024. Sin embargo, se ha tomado unos meses más para perfilarlo, probar nuevas capacidades y convertirlo en un modelo de razonamiento "mucho más capaz que Grok 2", según ha dicho Musk durante la presentación.

Esto coincide con lo que adelantó hace unos días, cuando dijo en X que había completado la fase de preentrenamiento del modelo "con 10 veces más de capacidad de procesamiento que Grok 2". No obstante, en el encuentro han sugerido que "quizá" tenga una capacidad 15 veces mayor.

En primer lugar, el propietario de X ha señalado que Grok y, más concretamente, la familia de modelos Grok 3, que ocultará sus procesos de razonamiento, está compuesta por Grok-3 Reasoning y Grok-3 Mini Reasoning, que responde con mayor rapidez, aunque sacrifica la precisión de sus respuestas para ello, tal y como ha sugerido.

Asimismo, ha señalado que esta familia se ha creado "con la misión de entender el universo" y que, por eso, aún está "en una especie de beta", ya que algunas de sus capacidades, aún son "irregulares", como el modo de voz. "Literalmente, en 24 horas veréis mejoras", han añadido durante la retransmisión otros miembros del equipo de xAI.

"Creemos que tener el mejor modelo de entrenamiento no es suficiente. La mejor IA debe pensar como un ser humano. Tiene que contemplar todas las posibles respuestas, autoevaluarse y verificar los errores", han añadido los responsables de Grok 3, que han indicado que puede resolver tareas relacionadas con disciplinas STEM.

En este sentido, xAI también ha afirmado que Grok 3 supera a GPT-4o en pruebas de referencia como USA Math Olympiad (AIME), que evalúa el rendimiento de un modelo en una muestra de preguntas de matemáticas, y GPQA, es decir, que evalúa modelos empleando problemas de física, biología y química de nivel de doctorado.

De ese modo, Grok 3 Reasoning y Grok 3 mini Reasoning pueden "pensar" cuidadosamente en los problemas, de manera similar a los modelos de razonamiento como o3-mini de OpenAI y R1 de DeepSeek. Asimismo, el primero supera a la mejor versión de o3-mini-high, en varios puntos de referencia, como AIME 2025.

Asimismo, los nuevos modelos de razonamiento de xAI sustentan una nueva función en la aplicación para iOS y Android denominada DeepSearch. Al igual que las propuestas de Google y OpenAI, que tienen un nombre similar, esta herramienta de búsqueda recopila información de internet y de la aplicación X para ofrecer un resumen exhaustivo según la consulta realizada.

Grok 3 llegará primero a los suscriptores del nivel Premium+ de X, aunque otras funciones estarán restringidas a un nuevo plan que xAI ha denominado SuperGrok. Éste desbloquea consultas adicionales de razonamiento, DeepSearch y ofrece generación ilimitada de imágenes.

Finalmente, los responsables de Grok han señalado que dentro de unas semanas los modelos Grok 3 estarán disponibles a través de la interfaz de programación de aplicaciones (API) de xAI, junto con DeepSearch, y que también planean liberar el código fuente de Grok 2 en los próximos meses.

Últimas Noticias

Registrados varios ciberataques contra páginas web en Groenlandia

Organismos daneses han detectado acciones atribuidas a hackers vinculados a Rusia, las cuales afectaron el acceso a portales en la isla sin comprometer información, según autoridades, en un contexto de maniobras militares de la OTAN y visita real

Registrados varios ciberataques contra páginas

Chile convoca al embajador de EEUU tras las sanciones de Washington a tres cargos del Gobierno Boric

El Ejecutivo sudamericano exige explicaciones al representante diplomático de Estados Unidos tras la imposición de restricciones a funcionarios cercanos al presidente Boric, calificando la falta de comunicación como una afrenta a la soberanía y los principios internacionales

Chile convoca al embajador de

Noboa afirma que las muertes violentas en Guayaquil bajaron un 26% tras el arresto de su alcalde "criminal"

El mandatario ecuatoriano sostiene que la captura de Aquiles Álvarez impulsó una drástica disminución de homicidios en la ciudad, niega motivaciones políticas en el proceso y defiende cambios urgentes en el sistema judicial y la lucha contra el crimen

Noboa afirma que las muertes

Tamara Falcó confía la celebración del cumpleaños de su suegra, Carolina Molas, a Ramón Freixá

La madre de Íñigo Onieva festeja su aniversario rodeada de familiares y amigos en un exclusivo restaurante dirigido por un chef galardonado con dos estrellas Michelin, en una animada jornada marcada por regalos y una notable ausencia

Tamara Falcó confía la celebración

El PMI de EE.UU. cae en febrero a mínimos de diez meses por el debilitamiento de la industria y los servicios

El estudio de S&P Global muestra que el ritmo de expansión empresarial en Estados Unidos se redujo a su nivel más bajo en diez meses, influido por la menor demanda, costos elevados y factores meteorológicos adversos, aunque la confianza para 2025 repunta

El PMI de EE.UU. cae