Reddit bloqueará el acceso de bots a sus datos públicos para evitar el 'web scraping' para el entrenamiento de IA

Guardar

El foro Reddit ha anunciado que actualizará su Protocolo de Exclusión de Robots (archivo robots.txt) para bloquear el acceso de 'bots' automarizados a sus datos públicos y evitar así el llamado raspado de datos o 'web scrapping', usando en el entrenamiento de la inteligencia artificial (IA). El raspado de datos o 'web scraping' es un proceso de recopilación de contenidos de páginas web mediante un 'software' que extrae el contenido HTML de estos sitios para filtrar la información y almacenarla, lo que se compara con el proceso automático de copiado y pegado. Si bien se trata de una práctica habitual y legal, va en contra de los términos de uso de algunas páginas web, ya que se puede ejecutar con fines malintencionados, tal y como han comprobado el desarrollador Robb Knight y Wired recientemente. Ambos han descubierto que la desarrolladora de IA Perplexity había ignorado el Protocolo de Exclusión de Robots de ciertos sitios web y ejecutado 'web scraping' con él para entrenar sus modelos de inteligencia artificial. Para evitar este tipo de situaciones, Reddit ha anunciado que en las próximas semanas actualizará su Protocolo de exclusión de robots, que "brinda instrucciones de alto nivel" sobre cómo permite y no permite que agentes terceros rastreen sus directorios. Una vez haya actualizado el archivo robots.txt, continuará bloqueando el acceso de 'bots' y rastreadores desconocidos en reddit.com y limitará su velocidad en la navegación. No obstante, mantendrá el acceso abierto a su contenido para investigadores y organizaciones como Internet Archive, a quienes considera "actores de buena fe" que acceden a sus contenidos "para uso no comercial". Por el contrario, la plataforma solicita que se pida permiso, y se pague una tarifa, cuando el acceso a los datos y herramientas tiene fines comerciales, lo que incluye el entrenamiento de modelos de IA. Con ello ha indicado que cualquiera que acceda a su web debe cumplir con sus políticas de uso, "incluidas las vigentes para proteger a los redditors", y ha puesto a disposición de los interesados una guía para acceder a sus contenidos de forma legítima. Conviene recordar, no obstante, que Reddit ya anunció a principios de mayo una nueva política de contenido público, surgida a raíz de constatar que "cada vez más entidades comerciales utilizan el acceso no autorizado o hacen un mal uso del acceso autorizado para recopilar datos públicos", incluidos los de la plataforma. También presentó un nuevo 'subreddit' para investigadores, con el que demostró su intención por preservar el acceso público al contenido de la plataforma para "aquellos que creen en el uso responsable y no comercial de los datos públicos".

Últimas Noticias

Siria condena los recientes bombardeos israelíes contra el sur del país

El Ministerio de Asuntos Exteriores sirio calificó de “brutal” la ofensiva del Ejército israelí lanzada tras choques en Sueida, responsabilizó a Israel por una “escalada peligrosa” y pidió intervención urgente del Consejo de Seguridad de la ONU

Siria condena los recientes bombardeos

Más de una decena de países se suman a los esfuerzos para garantizar el paso por Ormuz

Crece el respaldo internacional a la protección del estrecho, con veinte gobiernos de cuatro continentes que condenan los recientes ataques a embarcaciones y exigen a Irán detener acciones que ponen en riesgo el comercio global y la estabilidad regional

Más de una decena de

EEUU levanta las sanciones al petróleo de Irán que ya está cargado en buques

Washington autoriza transacciones con crudo iraní presente en embarcaciones desde marzo, tras una escalada en Oriente Próximo que elevó el costo internacional del combustible y generó tensiones por el cierre temporal de rutas marítimas clave en la región

EEUU levanta las sanciones al

Irán amenaza con atacar el puerto de Ras al Jaima, en EAU, si se "reanudan" ataques desde territorio emiratí

El ejército de Teherán advierte que responderá de forma contundente ante cualquier ofensiva emiratí sobre las disputadas islas del golfo Pérsico, luego de la interceptación de misiles y drones atribuidos a la República Islámica

Infobae

Trump ve bien que EEUU se retire de las bases militares de Rota y Morón

El mandatario estadounidense respalda la propuesta de retirar unidades militares tras el veto del gobierno español a su uso en conflictos con Irán, criticando además la falta de apoyo europeo en la defensa del estratégico estrecho de Ormuz

Trump ve bien que EEUU