
Google ha presentado Gemini 2.5, su modelo de inteligencia artificial más poderoso hasta la fecha, desarrollado por DeepMind. Disponible en opciones como Flash (optimizada para tareas cotidianas) y Pro (pensada para desafíos complejos), este avance representa un nuevo hito: llevar la IA multimodal a niveles superiores en razonamiento, programación y comprensión de diferentes tipos de contenido.
La principal novedad que destaca entre sus capacidades es la videocomprensión nativa. Gemini 2.5 Pro puede analizar y entender contenido visual y auditivo en videos, superar benchmarks generales y transformar esos videos en aplicaciones interactivas, código o animaciones. Se trata de un gran paso hacia IA que no solo “lee”, sino que también “mira” y “escucha”, estableciendo un nuevo estándar frente a modelos como GPT‑4.5 .
PUBLICIDAD
Por si fuera poco, esta tecnología incluye un modo avanzado llamada Deep Think, con capacidad de razonamiento paso a paso que mejora drásticamente su precisión en matemáticas y programación. Su ventana de contexto llega a un millón de tokens (próximamente a dos millones), lo que le permite manejar grandes volúmenes de datos e incluso código extenso sin perder coherencia.

Inteligencia visual y auditiva: vídeos que dejan de ser estáticos
Gemini 2.5 Pro entiende videos de forma nativa. En benchmarks como YouCook2 (captura de momentos), QVHighlights (retrieval de escenas importantes) y VideoMME, obtuvo resultados de vanguardia, superando a modelos entrenados específicamente para video.
PUBLICIDAD
Google ha mostrado ejemplos concretos, como apps interactivas iniciadas desde un video de YouTube o animaciones p5.js generadas automáticamente a partir de contenido audiovisual. Además, puede identificar momentos clave, contar eventos (como disparos en una grabación) y convertir videos en simuladores o juegos dinámicos.
Este tipo de capacidades abre la puerta a herramientas avanzadas para educación, producción multimedia y análisis visual. Con la integración en Vertex AI y la API de Gemini, desarrolladores podrán construir soluciones que extraigan insights de videos complejos en tiempo real.
PUBLICIDAD

Razonamiento, código y contexto largo: un AI todo en uno
El diseño de Gemini 2.5 Pro lo posiciona como un “modelo de pensamiento”: no responde directamente, sino que razona internamente, mejorando la exactitud y profundidad de sus respuestas. En evaluaciones como GPQA, AIME 2025 o el examen Humanity’s Last, obtuvo resultados top sin técnicas post‑procesadas.
También lidera el ranking de codificación: en WebDev Arena y SWE‑Bench Verified, duplica a versiones anteriores de Gemini y supera a varios competidores. Esto le permite generar interfaces visuales, apps o animaciones desde descripciones en lenguaje natural, incluso corrigiendo código existente con estilo y funcionalidad.
PUBLICIDAD
Además, maneja una ventana de contexto masivo: hasta un millón o dos millones de tokens, lo que facilita análisis sobre documentos extensos, bases de datos completas o grandes volúmenes de texto, audio, imagen, video y código sin perder precisión.

¿Qué cambia para desarrolladores y usuarios?
Gemini 2.5 Pro ya está disponible en Google AI Studio, en la app Gemini (para usuarios avanzados) y pronto en Vertex AI. La suscripción AI Ultra permite acceso prioritario, contextos más largos y uso de herramientas como Veo 3 (generación de video con audio), Imagen 4 y funciones como Deep Think.
PUBLICIDAD
Esto convierte la IA en una plataforma capaz de entender y generar contenido en múltiples formatos, lo que promete revolucionar sectores como la educación, desarrollo de software, creación multimedia y análisis empresarial.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Confiar en la IA para resolver problemas nos hace más propensos a fracasar sin esta tecnología, según estudio
Los investigadores analizaron el impacto de la inteligencia artificial en la resolución de problemas matemáticos y de lectura

Una solución para los centros de datos: placas de cobre que reducen hasta el 98% de consumo energético
La tecnología reduce el consumo por enfriamiento del 30% al 1,1% en grandes instalaciones

Investigadores crean un chip cerebral híbrido: fusionaron 70.000 neuronas vivas con componentes electrónicos
El diseño utiliza materiales flexibles compatibles con el tejido biológico para una integración prolongada

Esta nueva tecnología procesa 250 kilos de baterías usadas de autos eléctricos por hora para recuperar metales valiosos
El proyecto ReCAM transforma estos residuos en materiales listos para fabricar nuevas celdas

Cómo crear actualizaciones de estado en WhatsApp sin abrir la app
Este ‘atajo’ también permite visualizar estados desde la pantalla principal del celular



