Perdidos en la multitud: ¿es posible mantener la privacidad en tiempos de datos y algoritmos?

No se puede impedir que existan datos y es contraproducente no usarlos. Entonces, solo pueden verse resumidos y deben anonimizarse

Perdidos en la multitud: ¿es posible mantener la privacidad en tiempos de datos y algoritmos? (REUTERS / Luis Cortes)
Perdidos en la multitud: ¿es posible mantener la privacidad en tiempos de datos y algoritmos? (REUTERS / Luis Cortes)

“Qué gran desgracia la de no poder estar solo”. Con esta cita-epígrafe de Jean de la Bruyère, Edgar Allan Poe da comienzo a su cuento “El hombre de la multitud”. El narrador sigue durante un día entero a un hombre cualquiera. Un hombre que, al estar perdido entre los miles de hombres y mujeres de una ciudad, resulta completamente anónimo. El lector no se entera nada de él, y sobre el final del cuento vuelve a perderse en esa multitud.

La idea de perderse, de esconderse y mantener la privacidad por estar entre mucha gente, de que las individualidades se pierden en la masa, lleva a análisis de comportamiento profundos (uno de los más conocidos fue el análisis del hombre-masa de Ortega y Gasset, por mencionar uno en nuestro idioma), pero también puede aparecer en la mente de cualquier chico que juega a buscar a Wally en una página de sus famosos libros.

Históricamente, perderse en la multitud era una forma de pasar desapercibido. La mirada de los otros nos reconocía y nos etiquetaba, y era el primer paso para un sistema clasificatorio: de acuerdo a cómo éramos observados, podíamos ser clasificados como un miembro distinguido de la comunidad o un paria, un hombre probo o un delincuente. De allí que el anonimato fuera también una estrategia de supervivencia en las sociedades modernas.

Por supuesto, había profesionales de la observación, instituciones del Estado, quienes ejercían esa vigilancia de manera continua y finalmente eran los encargados de definir esas etiquetas. El panóptico de Foucault es un ejemplo paradigmático de vigilancia en la modernidad. En el panóptico, Foucault imagina un observador en una torre central y celdas distribuidas formando un semicírculo: las personas no saben si están siendo observadas o no en ese momento y el guardia central puede elegir a quién mirar.

En la actualidad, el panóptico como tal ha dejado de existir, y nadie piensa que haciéndose uno con la multitud se puede pasar desapercibido. Hoy sabemos con certeza que estamos siendo observados, pero no es una persona la que mira: es un algoritmo. No duerme, no descansa, no se aburre: solo registra y cuenta. Cada vez que pasamos la tarjeta de la SUBE, que compramos con débito o crédito o que nos movemos con el celular prendido damos información que se registra y tal vez se usa. Nuestras caras son reconocidas por cámaras con reconocimiento facial, incluso si caminamos entre una multitud. Las patentes de nuestros autos se registran y en muchos casos los mismos autos tienen dispositivos de seguimiento. Nos registramos en cientos de sitios web y bajamos aplicaciones que acceden a nuestros datos. En suma, estamos bajo una observación constante de nuestras acciones, de manera análoga al panóptico de Foucault. La diferencia, claro, es que somos individuos libres plenos de derechos y uno de esos derechos fundamentales es el derecho a la privacidad.

En el siglo XXI la discusión es fundamental: ¿es posible mantener la privacidad en tiempos de datos y algoritmos? ¿qué pasa con mi deseo de pasar desapercibido? Sobre todo porque tenemos sobradas pruebas de que el uso virtuoso de datos puede ser de extrema utilidad. Vimos un ejemplo muy claro en la pandemia: las poblaciones que pudieron usar la información para identificar posibles contagios, aislar casos y adelantarse a la enfermedad lograron resultados mucho mejores que aquellos que no contaron con la información o no supieron cómo usarla. El uso de la información puede permitir planificar, desarrollar y ejecutar mejores políticas y tomar medidas informadas, tanto en el sector público como en el privado.

Para pensar en soluciones debemos contemplar ambos aspectos: que la privacidad es un derecho de cada individuo y que el uso de datos puede tener fines virtuosos. ¿Qué podemos hacer, entonces, para resguardar el derecho a la privacidad? Una primera respuesta es regular y legislar: el Estado debe prohibir el uso discrecional de datos y tener registro de todas las bases existentes. Es una labor compleja, sobre todo porque el Estado no puede regular sobre el universo, solo sobre una jurisdicción. Además, una regulación que obligue a perder la oportunidad de contar con datos, en el afán de contrarrestar efectos negativos del uso de la tecnología, puede terminar resultando en peores condiciones para la población que se está tratando de proteger. Ignorar los cambios tecnológicos o tratar de retrasarlos nunca fue un buen camino.

Una segunda opción alternativa para resguardar el derecho a la privacidad es adoptar la idea de secretismo: los datos deben ocultarse, pueden usarse con un determinado fin pero no compartirse. En ese sentido, el sector privado en países como Argentina está mucho más avanzado que el público y ha sido mucho más consciente de esta ventaja. En otros países, los sectores públicos han incorporado el uso de datos e información como parte de sus capacidades desarrolladas o a incrementar. Estas son capacidades que el Estado argentino debe desarrollar para poder potenciar el uso de la información manteniendo una mirada ética sobre la privacidad y el derecho a pasar desapercibidos.

Y un tercer camino a tener en cuenta, como en el final del cuento de Poe, es retomar la idea de perderse en la multitud. No se puede impedir que existan datos y es contraproducente no usarlos, no compartirlos o ignorarlos. Entonces, solo pueden verse resumidos y deben anonimizarse. De las tres alternativas, es tal vez la que mejores resultados pueda ofrecer en el mediano plazo. Por supuesto, no es tan sencillo: muchas veces resumir o agregar lleva a que los datos pierdan su valor. Además, no siempre el promedio es lo que mejor explica a un grupo y resumir la información en dos o tres datos puede llevar a tomar decisiones equivocadas. Como ha ocurrido en numerosos ejemplos, a veces anonimizar los datos no es algo tan sencillo como sacar el nombre, el DNI y algún otro dato personal: en algunas ocasiones es posible reidentificar registros partiendo de datos que intuitivamente no tienen nada que ver con la identidad.

Un caso bien conocido es el de los taxis de Nueva York. Como parte de su política de datos abiertos, en 2013 la ciudad de Nueva York hizo pública la información de todos los viajes en taxi en la ciudad del año anterior, previamente anonimizados. Esta base incluía datos tales como inicio y fin de cada viaje, costo, propina y los datos encriptados de las patentes e identificación del conductor. Esta base parecía no contener información que pudiera violar la privacidad de los pasajeros o conductores. Sin embargo, Anthony Tockar, un estudiante australiano de posgrado en temas de datos, combinó esa información con otra fácilmente disponible sobre celebridades (fotos de paparazzis y notas periodísticas sobre espectáculos). De esta forma, logró identificar viajes de algunos famosos (en particular, de Bradley Cooper y Jessica Alba) y, mediante algunas comparaciones adicionales, identificó viajes regulares, domicilios y más información (“todos los jueves visita tal domicilio por 50 minutos, ¿será su terapeuta?”). Incluso se permitió hacer bromas sobre las propinas que dejaba Bradley Cooper.

En síntesis, no estamos condenados a elegir entre perder el valor de usar la información y perder la privacidad. Al menos, no necesariamente. Existen técnicas y soluciones algorítmicas que permiten compartir datos o anonimizar bases de datos manteniendo cierto grado de privacidad o al menos disminuyendo el riesgo de identificación. Se pueden implementar soluciones de gobierno de datos que permitan usar la información necesaria para tomar una determinada decisión, pero no más que eso. Las tres alternativas que aquí reseñamos —legislar y regular, la adopción del secretismo y la anonimización— no son excluyentes: es importante que el Estado sepa combinar estrategias para el uso virtuoso de datos. Tal vez podamos, después de todo, recuperar el derecho de perdernos en la multitud.

SEGUIR LEYENDO: