
OpenAI, fabricante de ChatGPT, anunció el martes 30 de julio que empezará a ofrecer a sus clientes su nuevo modo de voz, un mes después de retrasar el lanzamiento para realizar más pruebas de seguridad de la herramienta.
OpenAI presentó en mayo el modo de voz conversacional, capaz de detectar distintos tonos de voz y responder a las interrupciones como si fuera un humano. Pero algunos investigadores no tardaron en criticar a la empresa por mostrar un producto de inteligencia artificial que respondía a estereotipos sexistas sobre asistentes femeninas coquetas y complacientes.
PUBLICIDAD
La actriz Scarlett Johansson alegó que la empresa había copiado su voz de la película “Her”, en la que un robot de inteligencia artificial entabla una relación romántica con un hombre.

Los registros de OpenAI muestran que trabajó con una actriz completamente distinta y retiró la voz, llamada Sky, de su producto. En junio, dijo que retrasaría el lanzamiento del modo de voz para realizar más pruebas de seguridad. El nuevo modo de voz lanzado el martes no incluye la voz de Sky, según confirmó un portavoz de OpenAI.
PUBLICIDAD
Las empresas tecnológicas llevan años trabajando para crear chatbots conversacionales con IA. Alexa, de Amazon, y Siri, de Apple, son omnipresentes y millones de personas los utilizan para programar horarios y consultar el tiempo, pero no son lo bastante capaces para realizar tareas complejas.
Ahora, OpenAI, Google, Microsoft, Apple y una serie de otras empresas tecnológicas están tratando de utilizar los avances en IA generativa para construir finalmente el tipo de asistente que ha sido un elemento fijo de la ciencia ficción durante décadas.
PUBLICIDAD
Los fans y clientes de OpenAI han reclamado el modo de voz, y algunos se quejaron en Internet cuando la empresa retrasó el lanzamiento en junio. La nueva función estará disponible para un pequeño número de usuarios al principio, y la empresa la abrirá gradualmente a todos los clientes de pago de OpenAI en otoño.

Las versiones anteriores de ChatGPT tenían la capacidad de escuchar preguntas habladas y responder con audio transcribiendo las preguntas a texto, pasándolas por su algoritmo de IA y leyendo después su respuesta de texto en voz alta. Pero las nuevas funciones de voz se basan en el último modelo de IA de OpenAI, que procesa directamente el audio sin necesidad de convertirlo primero en texto.
PUBLICIDAD
Esto permite al robot escuchar varias voces a la vez y determinar el tono de voz de una persona, respondiendo de forma diferente en función de lo que piensa que son las emociones de la persona.
Esto abre un nuevo abanico de preguntas, como por ejemplo cómo entran en juego las diferencias culturales o si las personas podrían entablar relaciones con bots entrenados para responder a sus emociones de formas específicas.
PUBLICIDAD
OpenAI afirma que ha trabajado con personas que representan 45 idiomas y 29 “geografías” para mejorar las capacidades del modelo de IA. Sólo se podrán utilizar cuatro voces únicas, y la herramienta bloqueará los intentos de que el bot genere voces de personas reales, afirma la empresa.
(c) 2024, The Washington Post
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Cuánto tiempo permanece la cafeína en el cuerpo y cómo afecta el sueño
Una revisión de estudios científicos sugiere tomar la última taza al menos 9 horas antes de acostarse, una ventana mucho más amplia que la recomendación habitual

El principal asesor de inteligencia artificial de Trump dejará el cargo a fines de junio
Sriram Krishnan, un inversor tecnológico que dio forma a las políticas proindustria de IA, dejará la Casa Blanca

“Ronaldo, el perro” se vuelve viral por sus habilidades futbolísticas mientras crece la expectativa por el Mundial
Con cerca de 14 kilos, ataja pelotas y sostiene una concentración tan alta que su familia debe frenar para que se hidrate. Su técnica sorprende en las redes sociales

Estados Unidos y sus aliados de inteligencia emitieron una inusual advertencia conjunta sobre China
Los países que integran la alianza de inteligencia Five Eyes advirtieron que se están utilizando perfiles falsos y ofertas de trabajo dirigidas a oficiales militares, espías y otras personas con acceso a información clasificada o sensible
Las nuevas normas laborales del programa SNAP entran en vigor: qué cambia para los residentes de Washington D.C.
La ciudad comenzó a aplicar un requisito federal que exige acreditar 20 horas semanales de empleo o cumplir horas mensuales de capacitación o voluntariado, con impacto gradual al momento de la recertificación y temor a bajas por confusión



