Gemini incorpora Lyria 3 en Gemini para generar pistas musicales de 30 segundos con IA a partir de texto e imágenes

Usuarios de la versión beta ahora pueden crear canciones breves utilizando inteligencia artificial, personalizando sonido y portada mediante comandos escritos o imágenes y editando detalles como voz, idioma e instrumentos, según ha detallado Google en su blog oficial

Guardar
Imagen Y7VX3WUOBFBW3GU7K2GV4G5JOQ

"Si un usuario sube una fotografía de su mascota, Gemini puede identificar sus rasgos físicos e incorporarlos de manera personalizada en una pista musical", explicó Google a través de su blog oficial, al detallar las funciones más recientes de la versión beta de Lyria 3. La empresa presentó este miércoles la integración de este nuevo modelo de inteligencia artificial en la aplicación de Gemini, permitiendo que cualquier persona mayor de 18 años genere canciones breves basadas en comandos de texto o imágenes. Según comunicó Google, la herramienta ya está disponible para la versión escritorio y en los próximos días también llegará a dispositivos móviles.

De acuerdo con lo informado por Google, Lyria 3 posibilita la creación de pistas musicales de hasta 30 segundos a partir de instrucciones textuales, como puede ser "crea una canción rock sobre la pereza que da madrugar un lunes". También admite la subida de imágenes para aportar contexto visual y precisión temática, lo que deriva en una mayor personalización del contenido generado. La empresa recalcó que el propósito principal de estas pistas no es competir en calidad musical profesional, sino ofrecer nuevas maneras de autoexpresión y creatividad a través de la inteligencia artificial.

El mismo modelo Lyria 3 está implementado en la función 'Dream Track' de YouTube, donde los usuarios pueden crear música para acompañar vídeos en formato Shorts. Además, Gemini incorpora el generador de carátulas Nano Banana, que permite asociar cada pista con una imagen de portada diseñada por IA y acorde al género musical o a la temática elegida. Según publicó Google en su blog oficial, el usuario decide detalles del estilo visual y musical a través de comandos personalizados.

Entre las opciones de edición que brinda Lyria 3 se encuentran la posibilidad de modificar la voz, ajustar el tempo, seleccionar los instrumentos, cambiar la letra de la canción e incluso escoger el idioma. Según detalló Google, actualmente la herramienta está disponible en inglés, alemán, español, francés, hindi, japonés, coreano y portugués, con la promesa de añadir más idiomas próximamente. Los usuarios también pueden modificar cada elemento para adaptar la pista a gustos y necesidades particulares.

Todas las canciones y portadas generadas por Lyria 3 incluyen la marca de agua 'SynthID', una señal digital que permite identificar el contenido creado mediante inteligencia artificial. Google señaló que, más allá de SynthID, la app de Gemini expande las herramientas de verificación para abarcar no solo audio, sino también imágenes y vídeos, y así facilitar la detección de material producido artificialmente.

El tema de los derechos de autor y los límites éticos en el uso de IA para generar música también fue abordado por la compañía. Según informó Google, Lyria 3 está diseñado para producir pistas originales y evitar la reproducción exacta de estilos o voces de artistas específicos. Al recibir una instrucción como "Crea una canción al estilo de Queen", la IA estructurará la composición a partir de rasgos genéricos del género musical, sin replicar temas distintivos o trabajos originales. En palabras de Gemini, traducidas por Google: "Aunque no puedo replicar directamente la obra de artistas específicos, he capturado esa esencia teatral y grandiosa que buscabas. He diseñado una pista de 'Arena Rock' con una producción masiva: pianos potentes que marcan el ritmo, guitarras eléctricas con armonías vertiginosas y, por supuesto, una muralla de voces corales".

En cuanto al acceso, la versión beta de Lyria 3 está orientada al público adulto e inicialmente solo se puede utilizar en ordenadores a través de la aplicación de Gemini. El lanzamiento para móviles está previsto para los próximos días, ampliando así las posibilidades de creación musical mediante inteligencia artificial tanto en sesiones de escritorio como en dispositivos portátiles, según detalló Google.

En síntesis, Lyria 3 representa un paso en la integración de la inteligencia artificial como herramienta de creación musical dirigida al usuario general, facilitando tanto la personalización sonora como visual y adoptando mecanismos de identificación para el contenido artificial. Esta apuesta se orienta más hacia la exploración de formas novedosas de expresión y creatividad, que hacia la producción musical tradicional, tal como reportó el blog oficial de Google.