La inteligencia artificial que juega Minecraft como todo un experto

La IA tuvo que ver 70.000 horas de videos en YouTube para lograr entender el mecanismo del videojuego

Minecraft. (foto: Nintendo)
Minecraft. (foto: Nintendo)

El potencial de la inteligencia artificial (IA) nunca deja de sorprender a nadie. En los últimos meses, se ha podido ver de todo, desde un ingeniero de Google conversando con un chatbot hasta las locas creaciones del DALL-E Mini.

Ahora, como si eso no fuera suficiente, un modelo de OpenAI aprendió a jugar Minecraft viendo videos de YouTube, y funciona muy bien.

La compañía explica que el modelo entrenado para jugar Minecraft tiene habilidades que van más allá de las misiones básicas de supervivencia del juego, como nadar, cazar y cocinar animales. Incluso perfeccionó la técnica del “salto de pilar”, lo que le permitió crear un bloqueo temporal para llegar a lugares más altos.

Capacitando una inteligencia artificial para que sepa jugar

Si bien se ha podido apreciar entrenar a las diferentes IA para varias tareas antes, como conducir un auto, los investigadores tuvieron que superar varios desafíos para entrenar un modelo de IA en un juego de mundo abierto.

Primero, necesitan muchos datos, que se pueden encontrar fácilmente en YouTube porque Minecraft es uno de los juegos más populares.

Sin embargo, los videos subidos a YouTube por entusiastas de los juegos muestran lo que hacen en el juego, no cómo lo hacen. Por lo tanto, es un inconveniente para la IA, que no sabe qué hacer para realizar ciertas acciones. En este sentido, los investigadores aplicaron una nueva técnica llamada Video PreTraining (VPT).

Video PreTraining. (foto: OpenIA)
Video PreTraining. (foto: OpenIA)

En lugar de utilizar ‘etiquetadores’ para clasificar un gran conjunto de datos, los investigadores se centraron en una pequeña parte. Entonces, en esta sección, incluyeron datos importantes como pulsaciones de teclas y movimientos del mouse. Con esto, entrenaron un Modelo Dinámico Inverso (IDM) capaz de predecir la siguiente acción.

Entonces, con este conocimiento previo, pueden entrenar al modelo con 70.000 horas de video sin calificar. Es decir, se tomaron el tiempo de enseñar primero a la IA los conceptos básicos del juego para que aprendiera a identificarlos por sí mismo y realizar las operaciones complejas que los jugadores normalmente hacen en Minecraft, como las que se han mencionado anteriormente. Asimismo, también puede fabricar herramientas con diamantes.

“Aprender a talar árboles para recolectar madera y convertir esa madera en una mesa de trabajo es casi imposible de lograr con el aprendizaje por refuerzo desde cero”, aseguran desde OpenAI después de su última encuesta.

El hecho de que estos avances puedan extenderse más allá del mundo de los videojuegos, dice la compañía, podría ser útil en otras situaciones, “como aprender a usar una computadora”.

Minecraft. (foto: Vandal)
Minecraft. (foto: Vandal)

Una Inteligencia Artificial que coquetea con el usuario como en la película ‘Her’

La startup Sonantic desarrolló una voz que tiene algunas sutilezas que la hacen más natural en el modo de hablar.

Señalaron para The Verge, que la clave es la incorporación de sonidos que no son del habla en su audio; entrenando sus modelos de IA para recrear esas pequeñas tomas de aliento (diminutas burlas y risas medio ocultas) que le dan al habla real su sello de autenticidad biológica.

En este proyecto eligieron “el amor como tema general”, por lo que la AI coquetea con quien está interactuando con ella. Quienes “platicaron” con la AI señalan que al escucharla por primera vez suena como una voz humana, aunque después se notan los matices de que es un robot, ya que dicen, tiene “extraños espacios que quedan entre ciertas palabras y una ligera arruga sintética en la pronunciación”.

En un video de la compañía publicado en YouTube titulado “What’s Her Secret?” (¿Cuál es su secreto?) se escucha a una mujer asegurando estar enamorada, sin embargo, más tarde pregunta si aún sabiendo que nunca nació y nunca morirá podría ser amada (por quien la escucha).

En ese momento la imagen de una joven se transforma y aparecen los comandos de voz que son interrumpidos por expresiones como “respira” o “ríe”, aspectos que la dotan de cierta naturalidad.

SEGUIR LEYENDO

TE PUEDE INTERESAR