Gemini, el mejor modelo de inteligencia artificial de Google: conoce todos los detalles

Infobae conoció en exclusiva todos los avances de un modelo que promete llegar a todos los dispositivos y áreas de la sociedad. Se podrá adaptar para los celulares Pixel

Compartir
Compartir articulo
modelo de IA de Google (Google)
modelo de IA de Google (Google)

Lo que todos estaban esperando, el anuncio de Google DeepMind con Gemini, un modelo de inteligencia artificial (IA) multimodal y flexible que promete revolucionar la manera en que la tecnología se entrelaza con la cotidianidad y el desarrollo empresarial.

Sundar Pichai, CEO de Google y Alphabet, destacó que este nuevo modelo, parte de una iniciativa de la empresa por ser “IA-first”, tiene un rendimiento de avanzada en varios estándares académicos y es capaz de superar a expertos humanos en pruebas de comprensión de lenguaje multiconceptual.

Gemini, que ha sido optimizado para ejecutarse en dispositivos de diferentes capacidades (Ultra, Pro y Nano), ha mostrado un desempeño superior en 30 de 32 pruebas académicas aplicadas a modelos de lenguaje, incluyendo un puntaje de 90.0% en comprensión de lenguaje multiconceptual masivo (MMLU), eclipsando la capacidad de análisis de los especialistas humanos en áreas como matemáticas, física, historia y medicina.

Sundar Pichai puso énfasis en la continua aceleración del progreso de la IA en la empresa y la promesa de que estos avances sean de beneficio global.

El nuevo sistema, que es el resultado de un esfuerzo colaborativo amplio en Google, ha sido concebido para comprender y analizar información de manera eficiente, abarcando texto, código, audio, imagen y video.

Data center de Google almacenando información (Google)
Data center de Google almacenando información (Google)

A diferencia de modelos previos que combinaban componentes de IA separados, Gemini ha sido entrenado desde sus inicios para gestionar múltiples modalidades de forma integrada. Esto le ha permitido mejorar la comprensión y el razonamiento.

Por lo tanto, esta tecnología representa uno de los esfuerzos más grandes en ciencia e ingeniería desarrollados por Google en su más reciente historia.

Gemini 1.0 contiene capacidades avanzadas para el razonamiento multimodal complejo, ayudando a discernir conocimientos ocultos en grandes volúmenes de datos y refuerza el rol de la inteligencia artificial como un asistente intuitivo que puede ayudar en campos tan diversos como la ciencia, las finanzas y la programación.

Su alto rendimiento en labores de codificación y habilidad para entender, explicar y generar código de alta calidad en los lenguajes de programación más utilizados posicionan a Gemini Ultra como uno de los modelos fundamentales en el mundo de la codificación.

La versión especializada, AlphaCode 2, ha mostrado mejoras significativas en comparación con su predecesor, aumentando la eficacia en la resolución de problemas de programación complejos.

Sundar fue el encargado de dar la bienvenida a la nueva era con Gemini (Jason Henry/The New York Times)
Sundar fue el encargado de dar la bienvenida a la nueva era con Gemini (Jason Henry/The New York Times)

Responsabilidad y seguridad

Google asegura haber realizado las evaluaciones de seguridad más exhaustivas en cuanto a sesgo y toxicidad debido a que Gemini se está integrando en los productos de Google como el asistente digital Bard y el Pixel 8 Pro, mientras que Gemini Pro estará accesible para desarrolladores y clientes empresariales a través de Google AI Studio y Google Cloud Vertex AI desde el 13 de diciembre de 2023.

En su desarrollo, Google ha puesto énfasis en la responsabilidad y seguridad, trabajando en conjunto con expertos internos y externos para identificar y mitigar riesgos potenciales.

Gemini incorpora clasificadores de seguridad y filtros robustos para manejar contenido sensible, y se ha hecho uso de herramientas como Real Toxicity Prompts del Allen Institute of AI para la evaluación durante las fases de entrenamiento del modelo.

La compañía también ha destacado su colaboración con organismos como MLCommons, el Frontier Model Forum y el Secure AI Framework (SAIF), orientado a establecer prácticas seguras en inteligencia artificial.

Gemini Pro y Google Bard

Bard empleará una versión optimizada de Gemini Pro marcando la mayor actualización desde su lanzamiento, aunque por el momento en inglés.

El Pixel 8 Pro es el primer smartphone diseñado para utilizar Gemini Nano que ya está mejorando características en la aplicación Recorder y se espera su inclusión en otras aplicaciones de mensajería como WhatsApp.

En los siguientes meses, se introducirá Gemini en otros servicios como Search, Ads, Chrome y Duet AI. Adicionalmente, Gemini está siendo probado en Search, donde ya ha reducido la latencia en un 40% en inglés para usuarios en Estados Unidos.

Futuros Lanzamientos de Gemini

A partir del 13 de diciembre de 2023, desarrolladores y clientes empresariales tendrán acceso a Gemini Pro a través de la API de Gemini.

Google AI Studio proporciona herramientas para el prototipado y lanzamiento rápido de aplicaciones, y Vertex AI ofrece una plataforma de AI gestionada con controles de seguridad adicionales. Además, los desarrolladores de Android podrán trabajar con Gemini Nano a través de AICore en Android 14, disponible inicialmente en dispositivos Pixel 8 Pro.

Gemini Ultra se encuentra en la etapa final de controles de confianza y seguridad y se ofrecerá para experimentación a un grupo selecto antes de su lanzamiento general a principios del próximo año. Asimismo, Google planea lanzar Bard Advanced con Gemini Ultra para proporcionar una experiencia de inteligencia artificial avanzada.