Google ha presentado Gemma 4, un conjunto de modelos de inteligencia artificial diseñados para programar plataformas que procesan tanto texto como imágenes, y que en sus versiones más compactas también admiten audio.
Esta versión incorpora modelos con pesos abiertos, disponibles en variantes previamente entrenadas y en opciones ajustadas mediante instrucciones específicas.
Gemma 4 ofrece una ventana de contexto de hasta 256.000 tokensy soporta más de 140 idiomas. Según Google, Gemma 4 es su modelo más abierto hasta la fecha y puede utilizarse con fines comerciales.

“Gemma 4 es adecuado para tareas como la generación de texto, la programación y el razonamiento. Los modelos están disponibles en cuatro tamaños distintos: E2B, E4B, 26B A4B y 31B. Sus diversos tamaños permiten implementarlos en entornos que van desde teléfonos de alta gama hasta laptops y servidores, lo que democratiza el acceso a la IA de vanguardia”, explica Google.
Cuáles son las principales características de Gemma 4
Gemma 4 incorpora avances sustanciales en capacidad y arquitectura. Todos los modelos de la familia están concebidos como razonadores altamente capaces, con modos de pensamiento configurables que permiten adaptar el proceso de razonamiento según la tarea.
Entre sus principales novedades se encuentra la multimodalidad extendida: todos los modelos pueden procesar texto e imágenes con compatibilidad de resolución y relación de aspecto variables, mientras que las versiones E2B y E4B amplían esta capacidad a video y audio de forma nativa.

La arquitectura de Gemma 4 es diversa y eficiente, con variantes densas y modelos de combinación de expertos (MoE) en diferentes tamaños, lo que facilita una implementación escalable según las necesidades del usuario.
Los modelos más pequeños han sido optimizados para una ejecución local eficiente en laptops y dispositivos móviles, sin sacrificar rendimiento.
En cuanto a la ventana de contexto, los modelos pequeños admiten hasta 128.000 tokens, mientras que los modelos medianos llegan a 256.000 tokens, lo que permite trabajar con volúmenes de información significativamente mayores.
Además, Gemma 4 incorpora capacidades mejoradas de codificación y agente, logrando resultados destacados en pruebas de codificación y ofreciendo compatibilidad nativa con llamadas a funciones, lo que habilita agentes autónomos más sofisticados.

Por último, Gemma 4 introduce compatibilidad nativa con instrucciones del sistema, permitiendo la definición precisa del rol de system y facilitando conversaciones más estructuradas y controlables.
Qué se puede hacer con Gemma 4
Gemma 4 permite desarrollar y ejecutar una amplia variedad de aplicaciones impulsadas por inteligencia artificial, gracias a su capacidad para procesar texto, imágenes, audio y video.
Por ejemplo, las empresas pueden utilizar Gemma 4 para crear asistentes virtuales que gestionan consultas en varios idiomas y resuelven problemas complejos mediante razonamiento avanzado. En el ámbito educativo, Gemma 4 facilita la generación automática de resúmenes de textos e interpretaciones de imágenes para estudiantes con diferentes necesidades.

Además, los desarrolladores pueden aprovechar las capacidades de codificación mejorada de Gemma 4 para automatizar la escritura y revisión de código en múltiples lenguajes de programación, así como para integrar funciones personalizadas en aplicaciones empresariales.
Por su soporte para la ejecución local en dispositivos móviles y laptops, es posible implementar soluciones de reconocimiento de imágenes y procesamiento de voz directamente en el dispositivo, sin necesidad de conexión constante a la nube.
La compatibilidad nativa con instrucciones del sistema habilita la creación de agentes autónomos que pueden operar de forma más estructurada, como sistemas de atención al cliente que interpretan la intención del usuario y ejecutan tareas específicas, o herramientas de edición multimedia que procesan simultáneamente texto, imágenes y audio para producir contenido personalizado.
Cómo acceder a Gemma 4
Gemma 4 está disponible para descarga y uso en las plataformas Hugging Face y GitHub, lo que facilita el acceso a sus modelos abiertos para desarrolladores e investigadores.
Últimas Noticias
Códigos de Free Fire que ofrecen diamantes, skins y objetos exclusivos: lista completa para hoy 3 de abril 2026
Con las combinaciones alfanuméricas FU1I5O3P7A9S o F7F9A3B2K6G8, los usuarios pueden aumentar su arsenal y tener mayores ventajas dentro del juego

Cómo se ven los Saja Boys de Las guerreras K-pop en el mundo de Dragon Ball, según la IA
Esta fusión de universos animados es posible gracias a Nano Banana 2, un modelo de inteligencia artificial de Google, integrado en Gemini

Cómo crear videos con IA y añadirles música gratis con Google
En la plataforma Google Vids puedes crear personajes con inteligencia artificial y dirigirlos como si fueras un cineasta

Si tienes un iPhone o iPad antiguo, instala ya mismo esta actualización: te protege de ataques de pirateo avanzados
Para poner al día un dispositivo Apple, ingresa a Configuración, elige General y pulsa en Actualización de software

No perderás reuniones del trabajo: Google Meet ya está en CarPlay
Los usuarios pueden unirse a reuniones solo por audio y participar de forma manos libres mientras conducen



