El sitio estadístico de la Universidad de Oxford explicó los motivos por los que sacó a la Argentina de su mapa de datos

En diálogo con Infobae, Esteban Ortiz-Ospina, miembro de Our World in Data, relató cómo llegaron a la conclusión de que se estaban calculando incorrectamente las cifras

infobae-image

El martes 20 de octubre Argentina fue removida del sitio estadístico de la Universidad de Oxford, Our World in Data, una página en tiempo real sobre los números de la pandemia, con base en la Universidad de Oxford, luego de informar que las cifras oficiales agregadas por el Gobierno no reúnen la calidad suficiente para reflejar el alcance de las pruebas.

En este sentido, en diálogo con Infobae Esteban Ortiz-Ospina, miembro de Our World in Data, explicó los motivos de la decisión que tomó el organismo internacional.

La tasa positiva según los datos oficiales era del 76%. Es imposible saber exactamente en qué medida esta cifra está sesgada al alza, hasta que no sepamos en qué medida se estaban restringiendo los resultados negativos REUTERS/Agustin Marcarian
La tasa positiva según los datos oficiales era del 76%. Es imposible saber exactamente en qué medida esta cifra está sesgada al alza, hasta que no sepamos en qué medida se estaban restringiendo los resultados negativos REUTERS/Agustin Marcarian

-¿Por qué decidieron excluir los datos sobre pruebas de Argentina?

-Eliminamos los datos de tests en Argentina de nuestro conjunto de datos porque nos dimos cuenta de que muchas pruebas con resultado negativo no estaban siendo registradas en varias provincias. Este problema fue confirmado en un comunicado de prensa del Ministerio de Salud.

La decisión de eliminar los datos de tests de nuestro conjunto de datos se tomó siguiendo los criterios metodológicos de nuestro equipo técnico.

El subregistro de resultados negativos en los tests implica que la tasa positiva (la proporción de pruebas que arrojan un resultado positivo) está sobreestimada. Al momento de tomar la decisión de excluir los datos de Argentina de nuestro conjunto de datos, la tasa positiva según los datos oficiales era del 76%. Es imposible saber exactamente en qué medida esta cifra está sesgada al alza hasta que no sepamos en qué medida se estaban restringiendo los resultados negativos. Sin embargo, en cualquier caso, parece claro que la tasa positiva en Argentina es extremadamente alta para los estándares internacionales. Esto sugiere que no se están realizando suficientes pruebas para monitorear adecuadamente el brote.

Es importante recalcar que el problema de registros negativos no afecta los datos sobre casos confirmados o muertes, que siguen estando incluidos en nuestros datos de COVID-19.

el problema de registros negativos no afecta los datos sobre casos confirmados o muertes, que siguen estando incluidos en nuestros datos de COVID-19
el problema de registros negativos no afecta los datos sobre casos confirmados o muertes, que siguen estando incluidos en nuestros datos de COVID-19

-¿Qué datos excluyeron exactamente?

-Se excluyeron los datos sobre el número de tests y personas testeadas en Argentina. También se excluyeron otras métricas que se derivan de estos datos, como la tasa positiva y la proporción de pruebas por caso. Continuamos reportando datos sobre casos confirmados y muertes.

-¿Han excluido alguna vez datos de otro país?

-Tenemos criterios claros para la inclusión de datos en nuestra base de datos. No todos los datos de tests publicados por los países cumplen con nuestros criterios, y por lo tanto, no todos los países figuran en nuestro conjunto de datos.

En ocasiones ha sucedido que los datos oficiales no cumplen con los criterios sólo durante un período de tiempo. Una vez que los datos se publican nuevamente de acuerdo con nuestros criterios, los incluimos en nuestro conjunto de datos de nuevo.

Nos complace ver que las autoridades argentinas están al tanto del subregistro de pruebas negativas y están comprometidas a abordar el problema. Tan pronto como este problema se haya corregido claramente, comenzaremos a incluir datos de tests para Argentina en nuestro conjunto de datos nuevamente.

Aunque se han observado tasas positivas muy altas en otros países, nunca se había observado una tasa positiva tan alta como la calculada recientemente para Argentina
Aunque se han observado tasas positivas muy altas en otros países, nunca se había observado una tasa positiva tan alta como la calculada recientemente para Argentina

-¿Cómo se dieron cuenta de que Argentina no informaba el número de pruebas?

-Sospechamos que algo podría estar mal con los datos porque la tasa de positivos era extremadamente alta. Aunque se han observado tasas positivas muy altas en otros países, nunca habíamos observado una tasa positiva tan alta como la calculada recientemente para Argentina. Poco tiempo después, nos dimos cuenta de los reportes que informaban sobre problemas en la carga de resultados en algunas provincias.

-¿Por qué se refieren a un “sesgo” en los datos, y cómo lo detectaron?

-Cuando usamos la palabra “sesgo”, lo decimos en un sentido estadístico: introducir un sesgo significa utilizar un método de recopilación o recuento de datos que produce un resultado que no refleja con precisión la situación real. Aunque se han observado tasas positivas muy altas en otros países, nunca habíamos observado una tasa positiva tan alta. Esto nos hizo sospechar que algo se estaba calculando incorrectamente en los datos de Argentina.

Tan pronto como este problema se haya corregido claramente, comenzaremos a incluir datos de tests para Argentina en nuestro conjunto de datos nuevamente
Tan pronto como este problema se haya corregido claramente, comenzaremos a incluir datos de tests para Argentina en nuestro conjunto de datos nuevamente

-Si Argentina hubiera reportado correctamente los datos, ¿hay alguna manera de saber dónde estaríamos en el ranking?

-No podemos dar una estimación de cuál es la tasa positiva real de Argentina sin saber cuántas pruebas negativas no se han registrado.

-¿Argentina es el único país con este problema o también es un problema que tienen otros países?

-Actualmente solo somos conscientes de este problema en el caso de Argentina.

Sin embargo, existen problemas de calidad de datos en otros países. Por ejemplo, varios países de América Latina incluyen resultados positivos de anticuerpos en sus cifras de casos confirmados. Nuestros datos de pruebas no incluyen pruebas de anticuerpos (positivas o negativas), de acuerdo con nuestros criterios. Para estos países, incluimos cifras de pruebas (solo PCR) en nuestro conjunto de datos, pero no derivamos la tasa positiva, ya que los dos conjuntos de datos (casos y tests) no son comparables. Este es el caso actualmente en Brasil, Colombia, Costa Rica, Ecuador y Perú.

-¿Cuál creen que es la causa de este problema de datos?

-La recopilación, gestión y notificación de datos ha sido un desafío constante para muchos países a lo largo de la pandemia. En este sentido, el problema observado en los datos de tests en Argentina no es un ejemplo aislado.

También vale la pena señalar que, en este caso, el problema con los datos hace que la situación en Argentina parezca peor de lo que es en realidad, en el sentido que se está subestimando el volumen de pruebas y sobreestimando la tasa positiva. Más allá de esto, no podemos especular sobre las causas de este problema con los datos de prueba.

El CDC europeo publica estadísticas diarias sobre la pandemia de COVID-19 para todos los países disponibles según las cifras oficiales informadas
El CDC europeo publica estadísticas diarias sobre la pandemia de COVID-19 para todos los países disponibles según las cifras oficiales informadas

-¿Cómo se recopila la información sobre el COVID-19 en todo el mundo?

-En Our World in Data publicamos datos sobre COVID-19 basados en tres métricas clave: casos confirmados, muertes y pruebas. Todos nuestros datos sobre casos confirmados y muertes provienen del Centro Europeo para la Prevención y el Control de Enfermedades (CDC). El CDC europeo publica estadísticas diarias sobre la pandemia de COVID-19 para todos los países disponibles según las cifras oficiales informadas. Confiamos en el ECDC ya que recopila y armoniza datos de todo el mundo.

En cuanto a pruebas diagnósticas, ninguna organización ha construido previamente una base de datos global agregada sobre tests, por lo tanto, creamos un conjunto de datos de acceso abierto y público. Hemos construido y mantenido esta base de datos desde los primeros días de la pandemia. Para hacer esto, recopilamos información disponible públicamente publicada por fuentes oficiales de manera regular. Nuestro conjunto de datos se actualiza aproximadamente dos veces por semana.

Además de publicar estos datos, proporcionamos información clara y metadatos sobre las fuentes específicas de cada país. Nuestros datos de pruebas diagnósticas se han publicado en Nature Scientific Data, una revista académica revisada por pares.

-¿Tienen mecanismos establecidos para verificar la información?

-Nuestros datos sobre COVID-19 representan una recopilación de datos publicados por fuentes oficiales. Como tal, el objetivo de verificación es que lo reportado en nuestra página represente un registro preciso de los datos oficiales.

Para verificar que lo reportado por nosotros representa un registro preciso de los datos oficiales empleamos una variedad de procesos de validación. Verificamos cifras no válidas (por ejemplo negativos) y monitoreamos cada país para detectar cambios abruptos en las tasas de pruebas diarias, es decir, para controlar errores de redacción.

Para verificar lo reportado por el organismo internacional es necesario un registro preciso de los datos oficiales
Para verificar lo reportado por el organismo internacional es necesario un registro preciso de los datos oficiales

Para mitigar las disminuciones debidas a los retrasos en los informes, a veces excluimos las observaciones más recientes de un país si este muestra incorrectamente una disminución temporal en el número de tests.

Además, decenas de miles de personas ven nuestros datos todos los días, incluidos muchos investigadores de salud, legisladores y periodistas, de los que recibimos una gran cantidad de comentarios. Esto significa que cualquier discrepancia entre nuestros datos y los publicados en los canales oficiales se suele notificar rápidamente.

-¿Qué hacen con los países para los que los datos oficiales no son muy confiables?

-Nuestro objetivo es incluir todos los datos publicados por fuentes oficiales, si estos cumplen con nuestros criterios. Nosotros hacemos una evaluación con base en la información puesta a disposición del público por las autoridades competentes. Enumeramos todas las ambigüedades y los problemas de datos que conocemos para cada país en nuestras descripciones detalladas de las fuentes.

No intentamos evaluar la veracidad de los datos de tests más allá de los estándares establecidos en nuestros criterios, ni tampoco más allá de la información publicada por las autoridades competentes.

SEGUÍ LEYENDO

La Universidad de Oxford no confía en los datos de COVID-19 que informa el Gobierno argentino

Coronavirus: qué hizo mal la Argentina para convertirse en el quinto país con más contagios

Los expertos explican las cifras que llevaron a la Argentina a tener un millón de casos COVID-19 confirmados

MAS NOTICIAS

Te Recomendamos