Nvidia sorprende con nueva IA que programa en segundos, explica memes, analiza texto y mucho más

Guardar

Nvidia busca competir en contra de OpenAI y Meta. REUTERS/Dado Ruvic/Illustration/File Photo

Nvidia ha presentado su nuevo modelo de inteligencia artificial, NVLM 1.0, capaz de generar código en cuestión de segundos, responder consultas de cultura general e incluso explicar memes. Este modelo tiene la habilidad de comprender imágenes, gráficos y escritura a mano.

Según la compañía, NVLM 1.0 está diseñado para competir con los modelos de OpenAI y Meta. Nvidia destacó: “Presentamos NVLM 1.0, una familia de modelos de lenguaje grande multimodales (LLM) de clase de frontera que logran resultados de vanguardia en tareas de lenguaje-visión, rivalizando con los modelos propietarios líderes (por ejemplo, GPT-4) y los modelos de acceso abierto (por ejemplo, Llama 3-V 405B e InternVL 2)”.

La nueva familia de modelos de inteligencia artificial de Nvidia, denominada NVLM 1.0, tiene la capacidad de interpretar imágenes y ofrecer respuestas precisas. Un ejemplo proporcionado por la compañía muestra cómo el modelo responde a una foto de Jensen Huang, su CEO, cuando un usuario pregunta quién es la persona en la imagen.

La IA de Nvidia es capaz de comprender imágenes. (Nvidia)

El modelo también es capaz de interpretar imágenes de apuntes escritos a mano. En una demostración, se utilizó una imagen de un texto manuscrito que contenía un conjunto de parámetros de un código, acompañado de la instrucción: “Escribe código basado en el pseudocódigo proporcionado”.

Además, se presentó cómo NVLM 1.0 era capaz de comprender memes, como uno que muestra un tigre y un gato, para luego explicárselo al usuario.

La empresa explica el caso del meme de la siguiente manera:

“Por ejemplo, nuestro modelo puede entender el humor detrás del meme “abstracto vs. papel” en el ejemplo (a) al realizar reconocimiento óptico de caracteres (OCR) para reconocer las etiquetas de texto para cada imagen y usar el razonamiento para comprender por qué yuxtaponer “lo abstracto” (etiquetado con un lince de aspecto feroz) y “el papel” (etiquetado con un gato doméstico) es gracioso”.

NVLM 1.0 comprende texto escrito a mano. (Nvidia)

“El modelo NVLM-1.0-D 72B demuestra una buena capacidad de seguimiento de instrucciones. También puede generar una descripción detallada y de muy alta calidad de la imagen proporcionada”, puntualizan la compañía.

Nvidia ha subrayado que su modelo NVLM 1.0 ha sido entrenado utilizando datos seleccionados con sumo cuidado. Esto implica que se han elegido meticulosamente los datos empleados para su entrenamiento, con el fin de garantizar que sean de alta calidad y relevantes para una variedad de tareas.

Asimismo, se ha proporcionado información detallada sobre los conjuntos de datos multimodales (que incluyen texto, imágenes y otros tipos de información) utilizados tanto en la fase de preentrenamiento como en el ajuste fino supervisado, donde se optimizan las habilidades del modelo.

Los resultados del equipo de Nvidia indican que, para obtener un modelo de alta calidad, es más importante contar con conjuntos de datos variados y bien diseñados que con una cantidad masiva de datos.

Este modelo de IA es capaz de entender el humor para explicarlo a los usuarios. (Nvidia)

Según Nvidia, la calidad y diversidad de los datos es un factor más determinante que la cantidad (escala) de datos, sin importar qué tipo de arquitectura se utilice para el modelo. Esto sugiere que modelos como NVLM 1.0 pueden lograr un rendimiento superior cuando se entrenan con datos altamente selectivos y variados.

“Nuestro NVLM-D-1.0-72B demuestra capacidades versátiles en varias tareas multimodales al utilizar conjuntamente OCR, razonamiento, localización, sentido común, conocimiento del mundo y capacidad de codificación”, apuntan

De acuerdo con Nvidia, liderada por Jensen Huang, la compañía planea compartir los pesos del modelo y abrir el código de NVLM 1.0 para la comunidad, con el fin de impulsar la investigación en el campo de la inteligencia artificial.

Sin embargo, hasta el momento, el código de NVLM 1.0 aún no ha sido liberado. En la página oficial del proyecto, Nvidia ha señalado que esta apertura sucederá próximamente.

Últimas Noticias

YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy

YouTube, la plataforma de videos más famosa del mundo, genera alrededor de 15 mil millones de dólares al trimestre y al día son reproducidos alrededor de 5 mil millones de clips

Nvidia sorprende con nueva IA que programa en segundos, explica memes, analiza texto y mucho más

La compañía liderada por Jensen Huang desarrolló una inteligencia artificial que puede competir con las de OpenAI y Meta

Cómo es el nuevo modelo de IA de Nvidia

Cómo acceder a la IA de Nvidia

Últimas Noticias

YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy

YouTube, la plataforma de videos más famosa del mundo, genera alrededor de 15 mil millones de dólares al trimestre y al día son reproducidos alrededor de 5 mil millones de clips

Estudio sugiere que los juguetes con IA pueden representar un riesgo de seguridad para los niños

Los investigadores advierten que los juguetes con inteligencia artificial pueden malinterpretar emociones

Cómo funciona el detector de WhatsApp que alerta sobre enlaces vinculados a estafas

El sistema, impulsado por inteligencia artificial, notifica al usuario cuando detecta vínculos extraños o comportamientos irregulares en mensajes

YouTube en Colombia: la lista de los 10 videos más reproducidos que son tendencia hoy

En el 2006 la revista Time otorgó a YouTube el premio por el Invento del Año

Top 10 videos más vistos en YouTube Chile hoy

En el 2006 la revista Time nombró a YouTube como el Invento del Año

El insólito choque de Esteban Ocon a Franco Colapinto durante el GP de China de Fórmula 1: la reacción de Flavio Briatore

El análisis de Franco Colapinto tras sumar su primer punto con Alpine en el GP de China de la Fórmula 1: “Estoy con bronca”

Radiografía de la carrera de Colapinto en el GP de China de F1: sobrepasos y maniobras defensivas para completar una fantástica labor

Cuando volverá a correr Franco Colapinto en la F1: la agenda completa de la temporada tras el GP de China

La espectacular largada de Franco Colapinto en el Gran Premio de China de F1: pasó del puesto 12 al 6° tras la primera vuelta

Panam reflexionó sobre el fenómeno de Kidzapalooza y confesó su secreto para mantener su espíritu joven intacto

Quiénes son los artistas destacados que se presentan este domingo en Lollapalooza: Sabrina Carpenter, Doechii y Deftones

De la guerra de vedettes al chat de mamis: la relación de Wanda Nara y Evangelina Anderson a lo largo del tiempo

Natalia Oreiro: “Empecé a vaciarme de mi propia historia para entregarle mi cuerpo a la de otros”

Santiago Fillol, el guionista argentino de Sirat, la película candidata al Oscar: “Es un privilegio no buscado”

INFOBAE AMÉRICA

La Guardia Revolucionaria de Irán amenazó con “perseguir y matar” al primer ministro israelí Benjamin Netanyahu

De Carter a Trump, Estados Unidos ya no cree las mentiras del régimen cubano

Asesinatos de periodistas y auge de las “zonas silenciadas”: crece la preocupación en Ecuador por la violencia contra la prensa

Ucrania aseguró que Rusia estaría ayudando a Irán a atacar objetivos de EEUU en Medio Oriente

EN VIVO | Israel anunció el lanzamiento de una ola de ataques “a gran escala” en el oeste de Irán

Cómo es el nuevo modelo de IA de Nvidia

Cómo acceder a la IA de Nvidia

Temas Relacionados

Últimas Noticias

YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy

YouTube, la plataforma de videos más famosa del mundo, genera alrededor de 15 mil millones de dólares al trimestre y al día son reproducidos alrededor de 5 mil millones de clips

Estudio sugiere que los juguetes con IA pueden representar un riesgo de seguridad para los niños

Los investigadores advierten que los juguetes con inteligencia artificial pueden malinterpretar emociones

Cómo funciona el detector de WhatsApp que alerta sobre enlaces vinculados a estafas

El sistema, impulsado por inteligencia artificial, notifica al usuario cuando detecta vínculos extraños o comportamientos irregulares en mensajes

YouTube en Colombia: la lista de los 10 videos más reproducidos que son tendencia hoy

En el 2006 la revista Time otorgó a YouTube el premio por el Invento del Año

Top 10 videos más vistos en YouTube Chile hoy

En el 2006 la revista Time nombró a YouTube como el Invento del Año

El insólito choque de Esteban Ocon a Franco Colapinto durante el GP de China de Fórmula 1: la reacción de Flavio Briatore

El análisis de Franco Colapinto tras sumar su primer punto con Alpine en el GP de China de la Fórmula 1: “Estoy con bronca”

Radiografía de la carrera de Colapinto en el GP de China de F1: sobrepasos y maniobras defensivas para completar una fantástica labor

Cuando volverá a correr Franco Colapinto en la F1: la agenda completa de la temporada tras el GP de China

La espectacular largada de Franco Colapinto en el Gran Premio de China de F1: pasó del puesto 12 al 6° tras la primera vuelta

Panam reflexionó sobre el fenómeno de Kidzapalooza y confesó su secreto para mantener su espíritu joven intacto

Quiénes son los artistas destacados que se presentan este domingo en Lollapalooza: Sabrina Carpenter, Doechii y Deftones

De la guerra de vedettes al chat de mamis: la relación de Wanda Nara y Evangelina Anderson a lo largo del tiempo

Natalia Oreiro: “Empecé a vaciarme de mi propia historia para entregarle mi cuerpo a la de otros”

Santiago Fillol, el guionista argentino de Sirat, la película candidata al Oscar: “Es un privilegio no buscado”

INFOBAE AMÉRICA

La Guardia Revolucionaria de Irán amenazó con “perseguir y matar” al primer ministro israelí Benjamin Netanyahu

De Carter a Trump, Estados Unidos ya no cree las mentiras del régimen cubano

Asesinatos de periodistas y auge de las “zonas silenciadas”: crece la preocupación en Ecuador por la violencia contra la prensa

Ucrania aseguró que Rusia estaría ayudando a Irán a atacar objetivos de EEUU en Medio Oriente

EN VIVO | Israel anunció el lanzamiento de una ola de ataques “a gran escala” en el oeste de Irán