
A mitad de 2024, Google presentó su nueva inteligencia artificial conversacional llamada Gemini Live, una herramienta lanzada para los suscriptores de Gemini Advanced y solo en inglés, pero que ahora ha comenzado a abrirse a todos los usuarios de Android, incluyendo los que acceden de forma gratuita.
La característica principal de Gemini Live es su capacidad para mantener una conversación fluida y natural con el usuario, simulando una charla informal con una persona real.
A continuación se explica todo lo que hay que saber para aprovechar al máximo Gemini Live, una IA que habla como un humano, y cuáles son sus principales características.
Qué es Gemini Live y cómo funciona

Gemini Live es un modo de chat de voz basado en inteligencia artificial que permite a los usuarios interactuar con sus teléfonos usando lenguaje natural. A diferencia de otros asistentes virtuales que requieren comandos específicos, esta herramienta se enfoca en ofrecer una experiencia más conversacional y dinámica.
Es decir, se puede hacer pausas o interrumpir las respuestas de la IA sin necesidad de tocar el dispositivo, lo que facilita una interacción continua y más cercana a la forma en que las personas se comunican entre sí.
Además, una de las ventajas clave de este sistema es que puede funcionar en segundo plano. Esto significa que se pueden seguir usando otras aplicaciones o incluso bloquear el teléfono mientras la conversación con la IA continúa.
También, el sistema guarda una transcripción de la conversación para que se pueda revisar o retomar el diálogo en cualquier momento desde la sección de historial.
Cómo acceder a Gemini Live desde el celular

Acceder a Gemini Live en dispositivos Android es sencillo. Para activar el modo conversacional, solo hay que buscar la forma de onda circular en la parte inferior derecha de la pantalla de la aplicación de Google.
Una vez que se haya ingresado al modo de conversación, se podrá visualizar dos botones principales: “Mantener” y “Finalizar”. Estos permitirán gestionar la conversación fácilmente.
Asimismo, una característica única de Gemini Live es que, aunque se cierre la pantalla principal, el chat de voz seguirá activo en segundo plano. Esto ofrece la flexibilidad de continuar la conversación mientras se realizan otras tareas.
Qué tan avanzada es la inteligencia artificial de Google

Gemini Live no solo está diseñado para comprender y responder a comandos de voz o texto. También, tiene capacidades multimodales, lo que significa que puede procesar imágenes y, en el futuro, se espera que incluya soporte para video.
Esta característica lo convierte en una herramienta versátil para una amplia variedad de situaciones, desde hacer preguntas simples hasta llevar a cabo tareas más complejas y de mucho análisis.
Se puede mostrar una imagen a la IA y pedirle ayuda para identificar un objeto o proporcionar información relacionada con la foto. Este tipo de interacción hace que la experiencia sea mucho más completa y atractiva.
Cómo personalizar la inteligencia artificial de Google

Una de las innovaciones más interesantes de Gemini Live es la variedad de voces que ofrece. Google ha incorporado 10 opciones de voces, cada una con diferentes rangos y tonos, para que puedas personalizar tu experiencia según las preferencias. Estas son algunas de las voces disponibles:
- Ursa: Rango medio y entonación comprometida.
- Vega: Tono brillante y alto.
- Pegasus: Voz grave y comprometida.
- Órbita: Profunda y energética.
- Lyra: Tono brillante y alto.
- Orión: Profunda y brillante
- Nova: Rango medio con tono tranquilo.
- Dipper: Voz grave y comprometida.
- Eclipse: Energética con rango medio.
- Capella: Voz alta con acento británico.
Esta diversidad permite que los usuarios elijan la voz que mejor se adapte a sus necesidades o simplemente cambien de voz según su estado de ánimo o el tipo de interacción que desean tener.
Últimas Noticias
Reddit planea verificar usuarios reales para combatir la invasión de bots
En la opción menos intrusiva, se plantea utilizar la biometría del dispositivo para verificar que hay una persona real

Microsoft planea un Windows 11 menos saturado de anuncios y más enfocado en el usuario
Scott Hanselman expresó que la meta es lograr un sistema “más calmado y relajado”

Nadie está por encima del mercado: el jurado que condenó a Elon Musk
El hombre más rico del mundo escribió dos tuits que generaron controversia. Un tribunal de San Francisco tardó cuatro días en cuantificar el daño: 2.600 millones de dólares
El CEO de Pinterest apoya prohibir redes sociales a menores de 16 años por salud mental
En su artículo, Bill Ready sostiene que los niños están “viviendo el mayor experimento social de la historia”

ChatGPT incluirá anuncios: OpenAI lleva la publicidad a sus versiones gratuita y Go
La compañía apuesta por los anuncios para afrontar los retos de costes y competencia



