
ByteDance lleva meses extrayendo datos de Internet con un 'bot' llamado Bytespider, una actividad que hace a mayor velocidad que los 'bots' de otras empresas líderes en el mercado de los grandes modelos de lenguaje (LLM, por sus siglas en inglés). Los grandes modelos de lenguaje necesitan enormes cantidades de datos para su entrenamiento y estas solo se encuentran en internet, donde ya operan varios 'bots' para 'raspar' o extraer información de sitios web. Firmas como Google, Meta, Amazon, OpenAI y Anthropic utilizan sus propios 'bots', pero no son los únicos, ya que ByteDance también tiene el suyo, llamado Bytespider, que apareció en algún momento de abril, como han confirmado las firmas especializadas en este tipo de automatizaciones Kasada y Dark Visitors a Fortune. Bytespider tiene la particularidad de que en poco tiempo se ha vuelto muy agresivo en la recopilación de datos, como se desprenden de los informes de Kasada. Según el director ejecutivo de esta firma, Sam Crowther, extrae datos a una velocidad 25 superior a la de GPTbot (OpenAI) y 300 veces superior a la de ClaudeBot (Anthropic). El 'bot' de ByteDance, además, no respeta la línea de código robots.txt, que los editores de medios de comunicación pueden incorporar a su sitio web para indicar a los 'bots' que no extraigan datos. Tampoco lo respetan GPTbot y ClaudeBot. Detrás de esta extracción masiva de datos parece estar el desarrollo de un nuevo LLM por parte de ByteDance, según ha compartido una fuente familiarizada con el asunto con Fortune, que se usaría para la función de búsqueda de TikTok, según otra fuente.
Últimas Noticias
Hallado el cuerpo de una niña presuntamente víctima del hundimiento del barco de los españoles desaparecidos
Las fuerzas de rescate indonesias localizaron este lunes el cuerpo de una menor cerca de la isla de Padar, tras el naufragio de una embarcación. Continúan rastreos por otros ciudadanos europeos que aún permanecen sin localizar

Hallado el cuerpo de una niña presuntamente víctima del naufragio del barco de los españoles desaparecidos en Indonesia
Residentes indonesios encontraron el cadáver de una menor, de unos doce años, durante las tareas de rastreo cerca de la isla de Padar. El cuerpo fue trasladado al hospital regional para su identificación forense y confirmar la identidad junto a familiares

China anuncia maniobras militares alrededor de Taiwán a modo de "advertencia contra fuerzas separatistas"
El Comando de Operaciones Oriental de Pekín informó que las operaciones militares denominadas "Misión Justicia 2025" buscarán demostrar fuerza en puntos estratégicos frente a la isla, mientras Taipéi rechaza lo que califica de hostigamiento y amenaza a la región

Mueren seis personas, incluida una niña de dos años, en un tiroteo en el este de Ecuador
Autoridades ecuatorianas investigan un ataque en Puerto López que dejó varias víctimas y heridos a plena luz del día, mientras operativos policiales buscan a los responsables tras declaraciones que prometen “toda la fuerza” del Estado ante la violencia

Al menos trece muertos y casi un centenar de heridos al descarrilar el tren Interoceánico en el sur de México
Socorristas y fuerzas de seguridad han desplegado un operativo en Oaxaca tras el siniestro, mientras 62 personas permanecen hospitalizadas. Autoridades investigan las causas e informan que la mayoría de los 250 pasajeros ya se encuentran fuera de peligro
