Gemini 3.1 Flash-Lite, la nueva IA de Google que combina velocidad y bajo costo como nunca antes

Flash-Lite ya está disponible en vista previa y pronto será accesible para desarrolladores

Guardar
Gemini 3.1 Flash-Lite destaca por
Gemini 3.1 Flash-Lite destaca por su capacidad de respuesta ultrarrápida. (blog.google)

Gemini 3.1 Flash-Lite, la nueva IA de Google que combina velocidad y bajo costo como nunca antes. La compañía ha lanzado oficialmente esta versión optimizada de su modelo de inteligencia artificial, pensada para quienes buscan rendimiento y eficiencia sin sacrificar calidad.

Flash-Lite ya está disponible en vista previa y pronto será accesible para desarrolladores, consolidándose como la IA más rápida y económica de la familia Gemini.

Gemini 3.1 Flash-Lite: velocidad, eficiencia y ahorro en IA

Diseñado para gestionar grandes volúmenes de datos, Gemini 3.1 Flash-Lite destaca por su capacidad de respuesta ultrarrápida y sus costes operativos reducidos. Según datos de Google, este modelo es hasta 2,5 veces más veloz que la versión 2.5 Flash, manteniendo la calidad de las respuestas e incluso mejorándola en ciertos casos.

Gemini 3.1 Flash-Lite se encuentra
Gemini 3.1 Flash-Lite se encuentra en versión preliminar a través de la API en Google AI Studio. GOOGLE

El modelo hereda la función de control sobre los niveles de pensamiento, lo que permite a los desarrolladores ajustar el esfuerzo computacional según la complejidad de la tarea, optimizando aún más los recursos.

El precio es otro de sus grandes atractivos: Gemini 3.1 Flash-Lite reduce a la mitad el coste respecto a su predecesor, cobrando solo 0,25 dólares por millón de tokens de entrada y 1,50 dólares por millón de tokens de salida.

Esta estrategia busca facilitar el acceso a desarrolladores y empresas que requieren respuestas instantáneas y alto volumen de procesamiento, sin que el presupuesto sea un obstáculo.

En pruebas de rendimiento, Gemini
En pruebas de rendimiento, Gemini 3.1 Flash-Lite obtiene una puntuación Elo de 1432 en Arena.ai. (blog.google)

Comparativa de rendimiento y benchmarks frente a otros modelos de IA

En pruebas de rendimiento, Gemini 3.1 Flash-Lite obtiene una puntuación Elo de 1432 en Arena.ai, y destaca en evaluaciones como GPQA Diamond (86,9%) y MMMU Pro (76,8%), que miden razonamiento profundo y procesamiento multimodal respectivamente.

Frente a competidores como GPT-5 mini, Claude 4.5 Haiku o Grok 4.1 Flash, el modelo de Google sobresale especialmente en benchmarks de conocimiento científico, comprensión de videos y razonamiento en varios idiomas.

Aunque es una versión recortada, Flash-Lite mantiene una capacidad de razonamiento que rivaliza o supera a modelos de mayor tamaño. Sin embargo, en tareas de programación, su desempeño es inferior al de algunos rivales, como demuestran los resultados de LiveCodeBench donde no supera a GPT-5 mini ni a Grok 4.1 Fast.

Es menester señalar que su especialidad está en el seguimiento de instrucciones complejas y procesos repetitivos, más que en la escritura avanzada de código.

Gemini 3.1 Flash-Lite reduce a
Gemini 3.1 Flash-Lite reduce a la mitad el coste respecto a su predecesor. (Imagen Ilustrativa Infobae)

Disponibilidad y público objetivo de Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite se encuentra en versión preliminar a través de la API en Google AI Studio y para empresas mediante Vertex AI. Está orientado principalmente a desarrolladores que buscan velocidad y bajo coste en tareas de procesado masivo, mientras que Gemini 3.1 Flash, la versión estándar, se dirige más al usuario final con un enfoque más equilibrado.

La clave de Flash-Lite es su capacidad para ofrecer un rendimiento similar al de modelos grandes, pero optimizando costes y tiempos de respuesta. Los desarrolladores pueden controlar el nivel de esfuerzo computacional según la tarea, lo que permite adaptar el uso de recursos a cada necesidad específica.

Gemini libera una de sus funciones premium para todos los usuarios gratuitos

Google ha comenzado a habilitar para todos los usuarios una de las funciones más esperadas de Gemini: la posibilidad de que la IA recuerde información de conversaciones anteriores y la utilice en nuevos diálogos. Esta actualización tiene como objetivo evitar que los usuarios tengan que repetir detalles personales o profesionales cada vez que interactúan con el sistema.

Gemini guarda datos de conversaciones
Gemini guarda datos de conversaciones pasadas y los usa para personalizar futuras respuestas. (Imagen Ilustrativa Infobae)

Hasta el momento, solo los suscriptores premium disfrutaban de esta función de memoria en los chats, mientras que quienes usaban la versión gratuita debían ingresar sus datos en cada conversación. Ahora, la función llamada ‘Chats pasados’ se está desplegando globalmente y llegará a los usuarios de forma gradual.

Con esta herramienta, Gemini puede almacenar información relevante de charlas previas —como ocupación, intereses o preferencias alimentarias— y utilizarla para personalizar respuestas en futuras sesiones. Este avance se suma a una tendencia del sector, ya que otras IA como ChatGPT de OpenAI también desarrollan capacidades similares para mejorar la experiencia del usuario.