Google lanzó Gemini, su potente chatbot y asistente de voz basado en inteligencia artificial

En su carrera por competir con ChatGPT de OpenAI, Google retiró su chatbot Bard y presentó su nueva aplicación con más potencia

Compartir
Compartir articulo
Google avanza en la carrera de la inteligencia artificial con Gemini, ofreciendo una versión gratuita y otra avanzada por suscripción. (Google)
Google avanza en la carrera de la inteligencia artificial con Gemini, ofreciendo una versión gratuita y otra avanzada por suscripción. (Google)

Primero fueron los asistentes digitales parlantes como Siri, Alexa y Google Assistant. Luego hubo chatbots en línea como ChatGPT y Google Bard. Ahora, los dos se están fusionando. Este jueves 8 de febrero, Google presentó Gemini, una aplicación para smartphone que se comporta como un asistente digital parlante y como un chatbot conversacional.

Puede responder a peticiones de voz y texto, responder a preguntas, escribir poesía, generar imágenes, redactar correos electrónicos, analizar fotos personales y realizar otras acciones, como programar un temporizador o hacer una llamada telefónica.

Disponible de inmediato para los angloparlantes en más de 150 países y territorios, incluido Estados Unidos, Gemini sustituye a Bard y Google Assistant. Se basa en la tecnología de inteligencia artificial que la empresa lleva desarrollando desde principios del año pasado.

La nueva aplicación está diseñada para realizar una serie de tareas, como servir de tutor personal, ayudar a los programadores informáticos con las tareas de codificación e incluso preparar a los solicitantes de empleo para las entrevistas, dijo Google.

“Puede ayudarte a interpretar papeles en distintos escenarios”, afirmó Sissie Hsiao, vicepresidenta de la empresa y responsable de la unidad Google Assistant, durante una reunión informativa con periodistas.

Cuando ChatGPT llegó de la mano de OpenAI a finales de 2022, asombrando al público con su forma de responder preguntas, redactar trabajos trimestrales y generar código informático, Google se esforzó para ponerse al día. Al igual que otros gigantes tecnológicos, la empresa había pasado años desarrollando una tecnología similar, pero no había lanzado un producto tan avanzado como ChatGPT.

La pantalla principal de Gemini en un smartphone, mostrando su interfaz de usuario lista para acoger comandos de voz y texto. (Google)
La pantalla principal de Gemini en un smartphone, mostrando su interfaz de usuario lista para acoger comandos de voz y texto. (Google)

Google lanzó su propio chatbot, Bard, en marzo con críticas mediocres. En las semanas siguientes, la empresa fusionó sus dos principales laboratorios de Inteligencia Artificial -Google Brain y DeepMind- y anunció que el laboratorio combinado estaba desarrollando una nueva tecnología de IA llamada Gemini.

Gemini es lo que los investigadores llaman un gran modelo lingüístico, un sistema matemático que puede aprender habilidades analizando grandes cantidades de datos, como libros, programas informáticos y conversaciones en línea. Al identificar patrones en todo ese texto, un L.L.M. puede aprender a generarlo por sí mismo. Esto significa que puede escribir poesía, generar código informático e incluso mantener una conversación.

También es propenso a cometer errores. Puede equivocarse o “alucinar”, es decir, inventarse cosas. Gemini es un sistema “multimodal”, es decir, puede responder tanto a imágenes como a sonidos. Tras analizar un problema matemático que incluía gráficos, formas y otras imágenes, podía responder a la pregunta del mismo modo que lo haría un estudiante de secundaria.

En diciembre, Google utilizó una versión limitada de esta tecnología para mejorar Bard. Ahora, la empresa ha retirado el nombre de la marca y lanza una versión más potente de la tecnología a través de la aplicación Gemini, disponible en teléfonos Android y en la web. Una versión para iPhones llegará “en las próximas semanas”, dijo la compañía.

La empresa creó una versión gratuita pero limitada de la aplicación Gemini. Una versión más potente -denominada Gemini Advanced y basada en una versión del modelo de lenguaje Ultra de Google- está disponible por una suscripción mensual de USD 19,99. Google ofrece una prueba gratuita de dos meses.

Google ha publicado resultados de pruebas comparativas en los que se afirma que Ultra supera a la última tecnología de OpenAI, GPT-4, en varias áreas clave, como la generación de código informático y el resumen de artículos de noticias.

Gemini se encuentra ya disponible en más de 150 países, marcando un nuevo hito en la evolución de los asistentes digitales. (Google Blog)
Gemini se encuentra ya disponible en más de 150 países, marcando un nuevo hito en la evolución de los asistentes digitales. (Google Blog)

La aplicación Gemini también puede generar, analizar y responder a imágenes. Los usuarios pueden subir una foto de su fiesta de la Super Bowl, por ejemplo, y pedir a la aplicación que genere un pie de foto.

Google también dijo que ofrecería una tecnología similar a través de los servicios empresariales Google Workspace y Google Cloud. Esto permitirá a los clientes utilizar la tecnología junto con aplicaciones como Gmail y Google Docs.

En los teléfonos Android, la nueva aplicación sustituirá a Google Assistant si los usuarios se descargan Gemini. Al igual que Google Assistant, puede responder a comandos de voz, aunque también responde a comandos de texto.

Google ha afirmado que seguirá ofreciendo y mejorando Google Assistant.

El año pasado, OpenAI lanzó una versión similar de su chatbot ChatGPT que puede responder a comandos de voz. La mayoría de los expertos del sector creen que la tecnología de IA que impulsa aplicativos como ChatGPT se fusionará con asistentes digitales como Siri, de Apple, y Alexa, de Amazon, y los sustituirá.

(*) The New York Times

(*) Cade Metz escribe sobre inteligencia artificial, coches sin conductor, robótica, realidad virtual y otras áreas tecnológicas emergentes