Estas son las páginas web de las que ChatGPT extrae su información

Guardar

ChatGPT consulta miles de sitios web de los que extrae la información para generar una respuesta a los usuarios. (Pexels)

Los programas de inteligencia artificial como ChatGPT requieren grandes cantidades de información para ejecutar sus procesos y ofrecer la mejor calidad y cantidad de datos posibles, en el caso de OpenAI, se conoce que la data, en su mayoría, proviene de millones de páginas web.

Una investigación realizada por The Washington Post indica cuáles serían las páginas web que utiliza esta inteligencia artificial para “alimentarse” y generar las respuestas de las consultas realizadas por los usuarios.

Si bien no es posible identificar las páginas web exactas que se utilizan como fuente en el caso de ChatGPT pues solo OpenAI tiene la lista completa, sí es posible identificar de qué conjunto de datos extrae la información, no solo esta, sino la gran mayoría de inteligencias artificiales.

Te puede interesar: OpenAI no avanzará con GPT-5 y su CEO llamó “ridícula” la petición de suspender el avance de ChatGPT

La información en internet está organizada en grandes conjuntos que actúan como pozos que son visitados para extraer lo que se necesite de ellos.

El llamado C4 es el conjunto visitado por ChatGPT y otros modelos similares para generar respuestas a las consultas de internet y está compuesto por alrededor de 15.1 millones de sitios web de diferentes temas y orígenes.

La inteligencia artificial de ChatGPT se alimenta de información obtenida de diversos sitios web. (Hipertextual)

La investigación realizada indica que en este conjunto de datos se encuentran sitios web relacionados con los negocios, tecnología, noticias, arte, ciencia, entre otras especialidades.

Muchos contenidos extraídos de estos sitios están protegidos por derechos de autor, por lo que cada chatbot que utilice el conjunto C4 como fuente, podría estar infringiendo esta normativa en el proceso, ya sea para una consulta eventual o en caso de que un estudiante pida que la inteligencia artificial haga su tarea.

Según el Instituto Allen para la Inteligencia Artificial, que también participó en la investigación, el símbolo de copyright “©” aparece más de 200 millones de veces en el conjunto de datos C4.

Algunas de las páginas web de las que se extraen datos son Fool.com, Kickstarter.com, Patreon.com en lo que respecta a contenido relacionado con negocios, aunque muchos de ellos estén protegidos por derechos de autor.

Te puede interesar: ChatGPT: cuál es la información que recolecta de los usuarios y por qué

Sin embargo, estos no son los sitios web más utilizados en el cómputo global. Esta categoría la comprenden páginas como patents.google.com que recoge patentes emitidas en todo el mundo; wikipedia.org, la conocida enciclopedia online que puede ser editada por los usuarios; además de scribd.com, una biblioteca digital por suscripción.

Modelos de inteligencia artificial extraen sus datos de conjuntos de información que incluye resultados protegidos por leyes de copyright (REUTERS/Florence Lo)

El contenido buscado por las inteligencias artificiales también comprende algunos medios de comunicación y sitios web de recopilación de información; pero aunque muchos de ellos puedan ser fuentes fiables de producción de contenido que es útil para los usuarios, esto no implica que no se hayan incluido fuentes que aportan datos falsos, sesgados y en muchos casos incompleto.

Estos sitios web “informativos” incluyen aquellos que difunden teorías conspirativas o información falsa, además de datos que aportan pensamientos radicales que pueden ser dañinos para los usuarios, en caso de que esta información sea presentada a modo de respuesta a una consulta.

Te puede interesar: ChatGPT no es tan novedoso, estos son los chatbots que existieron antes

Una muestra del sesgo informativo es que, según el estudio, se detectó que de los 20 sitios web religiosos de los que se extraen datos, 14 de ellos eran cristianos, dos eran judíos y solo uno era de tendencia musulmana.

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

Estas son las páginas web de las que ChatGPT extrae su información

Modelos de inteligencia artificial generan sus respuestas con base en datos protegidos por leyes de copyright

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

La confesión de un “europibe” que es seguido por Scaloni para la selección argentina: “Soy de Boca y me encanta la Bombonera”

San Martín de San Juan y Deportivo Morón se clasificaron a los 16avos de final: así quedó el cuadro de la Copa Argentina

La impactante herida que sufrió el héroe del Atalanta por la patada en la cabeza que propició su remontada en la Champions

González Pírez habló sobre la salida de Demichelis en River y reveló el detrás de escena del “off” que cambió la relación con el vestuario

Cristiano Ronaldo anotó su gol 965 y lo celebró con un festejo inédito: el dardo detrás del gesto

Santiago del Moro dio detalles sobre la salud de Divina Gloria y reveló si volverá a la casa de Gran Hermano

Rocío Marengo se emocionó al recordar la internación de su hijo: “Nunca lloré tanto en mi vida”

Así quedó la primera placa de nominados de Gran Hermano Generación Dorada: tensión, estrategia y emociones fuertes

Lola Latorre recordó cómo vivió la infidelidad de su padre y el impacto en su familia: “Fue una situación horrible”

La delicada situación de María Fernanda Callejón: “Estaría viviendo en un hotel hace dos meses”

INFOBAE AMÉRICA

¿Cuánto dura una sesión de psicoanálisis? ¿Cinco minutos está bien?

De la crónica al confesionario, un curioso acercamiento al mundo de la psicodelia hoy

El dictador norcoreano Kim Jong-un amenazó con “destruir completamente” a Corea del Sur si percibe intimidaciones de Seúl

Un documental revive la leyenda de “Dr. J”, el superhéroe negro que cambió la historia del basquetbol

Aduanas de Panamá responde a Venezuela y niega apertura indebida de valija diplomática

Temas Relacionados

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

La confesión de un “europibe” que es seguido por Scaloni para la selección argentina: “Soy de Boca y me encanta la Bombonera”

San Martín de San Juan y Deportivo Morón se clasificaron a los 16avos de final: así quedó el cuadro de la Copa Argentina

La impactante herida que sufrió el héroe del Atalanta por la patada en la cabeza que propició su remontada en la Champions

González Pírez habló sobre la salida de Demichelis en River y reveló el detrás de escena del “off” que cambió la relación con el vestuario

Cristiano Ronaldo anotó su gol 965 y lo celebró con un festejo inédito: el dardo detrás del gesto

Santiago del Moro dio detalles sobre la salud de Divina Gloria y reveló si volverá a la casa de Gran Hermano

Rocío Marengo se emocionó al recordar la internación de su hijo: “Nunca lloré tanto en mi vida”

Así quedó la primera placa de nominados de Gran Hermano Generación Dorada: tensión, estrategia y emociones fuertes

Lola Latorre recordó cómo vivió la infidelidad de su padre y el impacto en su familia: “Fue una situación horrible”

La delicada situación de María Fernanda Callejón: “Estaría viviendo en un hotel hace dos meses”

INFOBAE AMÉRICA

¿Cuánto dura una sesión de psicoanálisis? ¿Cinco minutos está bien?

De la crónica al confesionario, un curioso acercamiento al mundo de la psicodelia hoy

El dictador norcoreano Kim Jong-un amenazó con “destruir completamente” a Corea del Sur si percibe intimidaciones de Seúl

Un documental revive la leyenda de “Dr. J”, el superhéroe negro que cambió la historia del basquetbol

Aduanas de Panamá responde a Venezuela y niega apertura indebida de valija diplomática