
Reflexiones y sugerencias para optimizar el conocimiento de la cantidad real de infectados por coronavirus en Argentina, basadas en modelos de investigación muestral.
El problema de la cifra total de afectados y el rol de los testeos
Durante los últimos días, en el marco de una serie de análisis basados en datos, cifras, curvas y proyecciones —entre otros temas— surgió una pregunta fundamental: ¿Cuántos son realmente los infectados que existen en la Argentina? ¿Son los 2.669 que reportan las cifras oficiales o podrían ser algunos o muchos más, en la medida en que pudieran existir portadores asintomáticos que, adicionalmente, representan potenciales propagadores involuntarios del virus?.
Una de las razones que podría postularse para justificar ese interrogante es que los testeos convencionales se realizarían sobre poblaciones “autoseleccionadas” las que, al ser definidas previamente como de riesgo, excluirían a la gran masa de personas asintomáticas.
En ese marco, surge el tema de la importancia de realizar testeos masivos. Cuestión que, invariablemente, conduce a tratar problemas de costos, logística y, sobre todo, de precisar qué cantidad de testeos fueron efectivamente realizados, cuántos deberían realizarse y cuántos podrían razonablemente hacerse, aclarando dónde, a quiénes y cuándo.
Adicionalmente, en ese debate subsisten dudas respecto de el/los propósito/s final/es para los que se realizarían dichos testeos. Pareciera que, en principio, habría dos posibles objetivos: a) testear para, en consecuencia, asistir a los casos hallados positivos y b) testear para conocer la magnitud del fenómeno del contagio y su probable evolución. La primera opción es estrictamente médica, mientras que la segunda reviste un énfasis típicamente epidemiológico. (1)
Aunque ambos objetivos pudieran coexistir y, además, operacionalizarse de modo convergente sobre idénticas poblaciones, podría también ocurrir que resultarán divergentes y hasta antagónicos. (2)
Por cierto, en una situación ideal se debería testear a toda la población y así se revolverían ambos problemas. Por un lado, se conocería con mayor precisión cuántos son los individuos sanos, cuántos los infectados y cuántos revisten gravedad. Además, se sabría con mayor rigor qué estrategias preventivas y asistenciales convendría implementar.
Pero obviamente, eso no es posible por los costos, la logística y el tiempo que demandaría testear a 40 millones de argentinos.
La importancia de los estudios sobre muestras representativas
Desde una perspectiva teórica (3) la referencia a estudios muestrales típicos de cualquier disciplina científica alumbra una solución acaso sencilla: deberían testearse muestras piloto representativas de determinadas poblaciones o conglomerados geográficos estratégicamente definidos.
Así, a través de un modo simple y económico podrían determinarse las tasas o incidencias de infectados sintomáticos, asintomáticos y normales.
Finalmente, se procedería a comparar ese resultado estadístico contra los datos actuales de infectados obtenidos a través de muestras de pacientes caracterizados como población de riesgo, o que ingresaron al sistema de salud por presentar síntomas.
Un ejemplo numérico hipotético para aclarar la propuesta
Al 16 de abril de 2020 las cifras oficiales indicaban que en Argentina existen 2.669 infectados y 122 fallecidos. En consonancia, lo informado y los modelos de curvas de evolución de la pandemia que apuntan a determinar si el sistema de salud podrá contener o no la demanda desencadenada, se basan sobre aquellos datos. (4)
En la tabla 1 se muestra ese cuadro de situación y su patrón evolutivo.

Ahora bien, supongamos que las cifras arriba consignadas (2669 infectados y 122 muertos), así como el patrón evolutivo, fueran correctas. En tal caso, tal como se muestra en la tabla 2, los resultados de una serie de estudios muestrales extraídos aleatoriamente de la población general deberían razonablemente concordar con esos valores.

Sin embargo, tal como se muestra en la Tabla3, bajo el supuesto de la que la cantidad real de infectados se multiplicara (por ejemplo: por un factor de 5), la realización de un testeo muestral de 5.000 casos, extraídos aleatoriamente de la población general, debería poner de manifiesto que la cifra de infectados resulta ostensiblemente mayor que lo hasta ahora estimado.
Específicamente, si tal como se muestra en la tabla 3, en ese testeo se evidenciara que la incidencia real de contagiados fuera de 0,1% (es decir: un caso cada mil) en lugar de ser de 0,02% (2 casos cada diez mil), entonces se sabría con mayor certeza tanto la magnitud actual del fenómeno como la de su evolución para determinado patrón de propagación viral.
Par decirlo de modo más drástico y terminante: si se estuviera subestimando la magnitud del fenómeno considerando, por ejemplo, apenas un 20% de la cantidad efectiva de contagiados reales (al punto de creer que existen 2.669 casos cuando, en rigor, ya habrían 12.855) la proyección a 90 días (6) determinaría que al cano de tres meses existirían 6.832.640 de infectados en lugar del 1.366.528 que cabría predecir a partir de la actual cifra de 2.669.

Síntesis
Entre tantas incertidumbres en torno al problema del coronavirus y al modo en que se lo debería afrontar, la determinación real de la cifra de infectados resulta un asunto crucial. En este artículo tratamos de sugerir que —a tales efectos y conforme al rigor del pensamiento estadístico— la estrategia de realizar estudios muestrales aleatorios podría resultar a la vez efectiva y económicamente razonable.
En efecto, si la cifra de infectados fuera (como actualmente se informa) de 2.669 personas, entonces un estudio muestral estándar de cinco mil casos (7) la pondría de manifiesto y, por ende, despejaría una de las incertidumbres presentes que incide contra el horizonte de las proyecciones para el tratamiento asistencial de la pandemia del coronavirus.
En contraposición —si a modo de ejercicio de simulación de pensamiento inverso— se supusiera la realización de similar testeo sobre esa misma muestra, pero para entonces descubrir que la tasa de incidencia de contagios fuera cinco veces (o cualquier otra cifra) mayor, se estaría así en mejores condiciones de optimizar el diseño de programas preventivos y asistenciales de un modo más acorde y realista.
---------------------------------------------------------------------------------------------------
1 En el sentido de la obtención de información crítica que permita optimizar el tratamiento de una pandemia.
2 Por ej. en virtud de la restricción de kits de testeos podría optarse por racionalizar su uso y reservarlo solo para los casos de pacientes que califican como riesgosos.
3 Es decir: sin juzgar cuestiones sobre costos o logística.
4 Se hace referencia al modelo de duplicación de los contagios cada 10 días que fuera expuesto por el Presidente Alberto Fernández en su conferencia del viernes 10 de abril. Los ejemplos citados en este artículo resultan acordes a ese patrón evolutivo, con independencia de que el sentido de prolongar la cuarentena radica precisamente en aplanar la curva involucrada.
5 En la columna 2 de la tabla se consignan diferentes tamaños muestrales que disminuirían a través del tiempo. La razón es doble y sencilla: a medida que aumenta el nivel de incidencia de contagiados se necesita un tamaño muestral menor para determinar esa tasa. Lo cual contribuye al ahorro de testeos. Inversamente, en rigor, lo aconsejable sería que disponer de un nivel muestral mayor en el primer estudio, dado que la incidencia resulta en teoría menor y que resulta crucial conocer prematuramente cuál es la magnitud de la discrepancia entre la cifra actual y la estimada.
6 Siempre aclarando que se daría bajo el supuesto del factor de propagación antes indicado.
7 En la segunda columna de las tablas 2 y 3 se consigan tamaños de muestra que van disminuyendo a través del tiempo. La razón es doble y simple. Por un lado, a medida que aumenta la incidencia de infectados en la población se requiere de un tamaño muestral menor para revelarla. Además, se ahorran costos de testeos. En rigor, lo ideal sería concentrar la mayor cantidad de éstos en la primera muestra porque, por un lado, es allí donde conviene verificarse prematuramente qué grado de discrepancia puede existir entre el dato oficial actual y el que se estimare. Pero, además, dado que se estaría ante el nivel de incidencia de contagio menor de la serie, es allí donde se necesita entonces el tamaño muestral mayor para ponerlo de manifiesto.
---------------------------------------------------------------------------------------------------
* el autor es analista político y director de la consultora Federico González y Asociados
Últimas Noticias
Bomberos voluntarios, recursos imprescindibles
La responsabilidad y minuciosidad en el tratamiento de fondos públicos es clave para garantizar el funcionamiento de los cuerpos de Bomberos Voluntarios

Glaciares: cuando se intenta plebiscitar lo que debe votar el Congreso
La controversia por la reforma legislativa pone en evidencia las tensiones entre la participación social y las reglas del sistema representativo, cuestionando los alcances y límites de los mecanismos empleados para legitimar decisiones de alto impacto

El nuevo mapa democrático de América Latina
América Latina y el Caribe reflejan una tendencia de debilitamiento democrático sostenido, pese a seguir entre las regiones más democráticas del mundo

¿Cuánto margen tenemos para moldear el despliegue de la IA?
La gobernanza adaptativa de la inteligencia artificial en espacios subnacionales propone articular actores públicos, privados y sociales para maximizar beneficios locales

Mes de la Mujer o mes del orgullo de vivir en un país sin una sola ley patriarcal vigente desde hace décadas
Esto no fue resultado de la confrontación de géneros sino de la cooperación, de eso que los franceses llaman “mixité”. Por ese camino debemos seguir


