Wikimedia Foundation ha decidido crear un conjunto de datos estructurados que ha puesto a disposición de la comunidad dedicada al aprendizaje automático, para que puedan usarlos en el entrenamiento de sus modelos.
La organización responsable de la popular enciclopedia 'online', Wikipedia, alertó recientemente de un aumento del tráfico procedente de programas automatizados para descargar sus contenidos y usarlos en el entrenamiento de modelos de inteligencia artificial.
Esto estaba repercutiendo su capacidad de operar, ya que tenían que dedicar más tiempo y recursos a responder al tráfico no humano, lo que suponía un mayor coste de uso y mantenimiento de las infraestructuras.
Ahora, ha anunciado la creación de un conjunto de datos estructurados de Wikipedia que ha compartido en Kaggle de manera gratuita y abierta, para que pueda puedan usarse en "el entrenamiento de modelos, la construcción de características y para probar canales de procesamiento de lenguaje natural", como explica en un comunicado.
Los datos se han compartido en un formato que pueden leer los ordenadores, en inglés y francés, e incluyen "resúmenes, descripciones breves, datos clave-valor de estilo infobox, enlaces de imágenes y secciones de artículos claramente segmentadas".
Últimas Noticias
La UE pide una moratoria de los ataques a instalaciones energéticas y de agua en Irán
La nominación del secretario de Seguridad Nacional propuesto por Trump avanza en el Senado
La subida del gas natural se modera hasta el 17 %, por debajo de los 64 euros
Xiaomi presenta tres nuevos modelos de IA para que los agentes trabajen, interactúen y canten en el mundo real
La compañía amplía su apuesta por la inteligencia artificial con nuevas soluciones que permiten a asistentes digitales ejecutar tareas complejas, interactuar por voz e incluso entonar melodías de manera natural en escenarios laborales, colaborativos y cotidianos
