Sosa Escudero, el autor que combinó Borges y Big Data: “Hice un divertimento intelectual”

El autor de “Borges, big data y yo” dialogó con DEF sobre la ciencia de datos, los algoritmos y el método estadístico con relación al escritor argentino.

Compartir
Compartir articulo
"Hay ciertas cosas que son centrales en la literatura de Borges, como la tensión entre la realidad y sus representaciones, la infinita réplica de objetos y símbolos, no deja de hacer las mismas observaciones que la estadísticas", dice Sosa Escudero. Foto: AP.
"Hay ciertas cosas que son centrales en la literatura de Borges, como la tensión entre la realidad y sus representaciones, la infinita réplica de objetos y símbolos, no deja de hacer las mismas observaciones que la estadísticas", dice Sosa Escudero. Foto: AP.

La ficción, cuando es buena, establece vínculos complejos con la realidad: la explica, la enriquece, la anticipa, o la extiende. La ley se cumple, sobre todo en el caso de Borges, autor que no se agota en la literatura, sino más bien al contrario: se expande desde la literatura hacia disciplinas diversas; de ahí, la proliferación de libros que unen a Borges y la física cuántica, Borges y la programación, Borges y la física.

En el mismo sentido, Walter Sosa Escudero escribió Borges, big data y yo (Siglo XXI Editores). El autor, licenciado en Economía (UBA), doctor por la Universidad de Illinois y autor de Big data establece relaciones entre la estadística y el autor argentino. Sin embargo, lejos de que Borges quede limitado a ser instrumento para entender otra cosa, tomando como escenario cuentos como “Funes el Memorioso” y “Pierre Menard, autor del Quijote”, o ensayos como “Kafka y sus precursores”, Sosa Escudero ilumina conceptos de la estadística y la ciencia de datos, pero también la propia obra de Borges.

-¿Qué potencial vio en la literatura y, particularmente, en Borges para hablar de estadística y procesamiento de datos?

-Varias cosas. Primero, que Borges es un autor universal. Suena a frase hecha, pero lo que tiene Borges es que abarca todos los temas. Eso es una noticia buena y mala a la vez. Buena, porque al ser un autor universal lo podés llevar a cualquier lado; en cierto sentido, Borges les habla a todos los ámbitos. La mala noticia es que puede resultar forzado. Si uno se propone escribir sobre Borges y cualquier cosa, lo va a terminar encontrando. Yo nunca me propuse escribir sobre Borges y la estadística, sino que lo fui encontrando. La propia energía que le había dedicado por separado a leer al autor y a trabajar con la estadística, que es a lo que me dedico profesionalmente, hizo que a lo largo de los años se acumulen un montón de anécdotas, ejemplos e historias que tienen que ver con el cruce entre los dos universos. Nunca me puse a investigar qué nexos había, pero el punto de partida es que ciertas cosas que son centrales en la literatura de Borges, como la tensión entre la realidad y sus representaciones, la infinita réplica de objetos y símbolos, no deja de hacer las mismas observaciones que la estadística. En definitiva, lo que hice fue un divertimento intelectual.

Para el autor, "lo esencial de la estadística no es el recuerdo sino el olvido.No es el registro ,sino el ejercicio de separar la señal del ruido". Foto: Fernando Calzada.
Para el autor, "lo esencial de la estadística no es el recuerdo sino el olvido.No es el registro ,sino el ejercicio de separar la señal del ruido". Foto: Fernando Calzada.

-Antes de ir a Borges: ¿es lo mismo estadística que ciencia de datos?

-A mí, se me hace que, si esta pregunta la hacemos en 20 años, vamos a tener una respuesta muy precisa. Desde cierto punto de vista, es el mismo nombre para una disciplina vieja. Pero, si uno empieza a hilar más fino, creo que hay espacio para una ciencia de datos más allá de la estadística, si la ciencia de datos se entiende como un proceso integrador e iterativo de cosas que son de la estadística, matemática, computación, pero también de las disciplinas que la convocan, como economía, biología, agronomía, física, lingüística, y disciplinas aparentemente blandas, como la comunicación y el diseño. Anteriormente, las distintas disciplinas veían el proceso de análisis de datos como un proceso fabril: el que recoge los datos, el que los clasifica, el que los interpreta. La ciencia de datos, si tiene intenciones de existir, tiene que ver con todo eso como un proceso iterativo e interactivo.

FUNES, ENTRE LA MEMORIA Y LA ESTADÍSTICA

Uno de los cuentos clásicos del autor argentino es “Funes el memorioso”. Allí, un personaje, llamado Borges, conoce a Funes, un joven uruguayo que tiene la memoria absoluta. Todo lector de Borges lo sabe: Funes podía ver de un vistazo “todos los vástagos y racimos y frutos que comprende una parra”. Recordar un día en detalle le llevaba, exactamente, un día entero. El personaje Borges admiraba a Funes, pero al mismo tiempo señalaba lo que podría entenderse como una falencia; Funes, al tener tan buena memoria, no podía entender ideas abstractas: “Le molestaba [a Funes] que el perro de las tres y catorce (visto de perfil) tuviera el mismo nombre que el perro de las tres y cuarto (visto de frente)”.

-En el capítulo sobre “Funes el memorioso”, usted señala que “el servicio de la estadística consiste en aportar no solo fórmulas y algoritmos, sino también consensos”. ¿La única forma de captar la realidad es resumiéndola?

-La estadística no es tanto de que se pueda, sino de que se deba. Uno podría pensar que no hay representación más fiel de la realidad que la realidad en sí misma. Funes dice: “Lo que yo percibo como datos son los datos, no entiendo por qué tengo que resumirlo de alguna manera”. El partido de la ciencia, y también de la comunicación, no es tanto que se pueda resumir, sino que se deba. Se gana mucho en ver qué tienen en común las cosas, y no las diferencias. Obviamente, hay diferencias entre Brasil, Uruguay, Chile, Perú, pero lo que intenta hacer un científico social es trabajar con esa doble tensión. Por un lado, querés preservar la esencia de los países, pero, por otro lado, cuando ves el comportamiento económico o político, hay ciertos fenómenos que subyacen a la región. Entonces, la necesidad de trabajar ciertas cosas como propias de una región, más allá que de sucedan en una ciudad o país, tiene que ver con que es más conveniente hacerlo. En el cuento, el personaje de Borges, a diferencia de Funes, sugiere la relevancia de abstraer, dice que pensar es abstraer, olvidar diferencias. La esencia de la estadística no es el recuerdo, sino el olvido. No es el registro, sino el ejercicio de separar la señal de ruido.

"Lo que muchas veces obsesionaba a Borges y Bioy Casares es que si reúno datos en la cabeza eventualmente me transformo en otro Funes que recopila hechos folklóricos y tarda demasiado tiempo en aprender leyes", comenta el escritor. Foto: Archivo DEF.
"Lo que muchas veces obsesionaba a Borges y Bioy Casares es que si reúno datos en la cabeza eventualmente me transformo en otro Funes que recopila hechos folklóricos y tarda demasiado tiempo en aprender leyes", comenta el escritor. Foto: Archivo DEF.

-En su diario sobre Borges, Bioy Casares escribe: “Domingo, 5 de mayo de 1968. Dice Borges que los concursos de preguntas y respuestas, tan frecuentes en la radio, son perjudiciales porque estimulan una miscelánea de conocimientos inútiles y son un pretexto para no pensar. ‘¿Qué diría Coleridge?’ –añade–. Les preguntaría: ‘Bueno, señores, ¿qué conclusión sacan ustedes?’. No sacan ninguna conclusión”. ¿Encontrás una relación con la estadística?

-La pregunta subyacente es qué es más real, si la realidad –vaya uno a saber qué es eso– o lo que uno construye de la realidad. “Tlon, Uqbar, Orbius Tertius” tiene que ver con jugar esa doble carta: la construcción que uno hizo se vuelve más real que la realidad. Un estadista no estudia datos, estudia lo que estos quieren decir: ciertos patrones, regularidades, que, munidos de otras aseveraciones, pueden decir algo sobre la existencia de ciertas leyes o fenómenos invariables en el tiempo y el espacio. Lo que muchas veces les obsesionaba a Borges y a Bioy es que, si reúno datos en la cabeza, eventualmente me transformo en otro Funes, que recopila hechos folclóricos y tarda demasiado tiempo en aprender leyes. El fragmento que leíste me llama a pensar que no hay una línea que divida los datos de la teoría, a las cosas de lo que opino de las cosas: están en igualdad de condiciones. Una discusión antigua es que no es obvio que los datos anteceden a la teoría, ni la teoría a los datos. La existencia de ambos tiene que ver con un proceso iterativo.

-¿Se puede disociar fácilmente dato de relato, como se suele decir en las conversaciones de sobremesa?

-No. Parte de la respuesta está en otro relato de Borges, “El idioma analítico de John Wilkins”. El orden subyacente a los datos no es independiente de lo que yo opino de cómo funciona el mundo. Muchas veces, mi criterio para determinar qué es un dato lo obtengo de un relato. Pero también es cierto que muchos relatos surgen de datos. Si a una persona que cree que la inflación es un fenómeno explicable únicamente por la emisión de dinero, uno le pide que le consiga datos, va a conseguir datos de emisión de dinero e inflación. Otra cosa no es un dato para él. Si otra persona dice: “Para mí, la inflación es eso, pero también la distribución del ingreso y las negociaciones salariales”, entonces, para esa persona, la emisión monetaria anual es un dato, pero también la distribución del ingreso, las negociaciones salariales son un dato, las noticias. El tipo de dato que vayas a buscar no deja de estar en alguna medida supeditado a lo que opines. Al mismo tiempo, claro, siguiendo el método hipotético deductivo, los datos validan o no lo que querés decir, pero ciertamente está claro que los datos no tienen una entidad aislada de la propia entidad que tiene el relato.

FAKE NEWS, DATOS Y POLÍTICA

-¿Los datos confiables pueden contribuir a la proliferación de fake news? ¿O, si hay datos confiables, todo lo que se siga de ellos es verdadero?

-Es una discusión profunda. Supone que doy un curso de fotografía. Mi curso es espantoso, se desgrana, y a fin de año les pregunto a los que quedaron qué les pareció el curso. Los alumnos responden que les pareció muy bueno, entonces yo recolecto el dato de que todos los encuestados dicen que es muy bueno. Si con esa información digo que “la gente opina” que el curso es bueno, no es correcto, porque no tengo la opinión de la gente que se fue del curso. El dato cierto es que el 100 por ciento de los encuestados contesta que el curso es bueno. La pregunta es qué puedo extrapolar a partir de ahí, y eso no tiene que ver con el dato sino con lo que yo creo del dato. En definitiva, los relatos, las aseveraciones no surgen del dato en sí, sino de la tensión entre el dato y lo que yo quiero que el dato me diga. El desafío es hasta qué punto la parte puede hablar por el todo.

Sosa Escudero dice: "Las aseveraciones, los relatos no surgen del dato en sí, sino de la tensión entre el dato y lo que yo quiero que el dato me diga. El desafío es hasta que punto la parte puede hablar del todo". Foto: Fernando Calzada.
Sosa Escudero dice: "Las aseveraciones, los relatos no surgen del dato en sí, sino de la tensión entre el dato y lo que yo quiero que el dato me diga. El desafío es hasta que punto la parte puede hablar del todo". Foto: Fernando Calzada.

-Antes mencionaba que en un solo agente se nuclea la recolección, el procesamiento, la interpretación de datos. ¿El hecho de que las empresas administren esos datos puede tener influencia en la política?

-Sí, pero no tanto como se cree. No hay evidencia seria de los algoritmos en las decisiones de las personas. Para saberlo, debería hacerse algo parecido a un experimento. Lo que pasa en la práctica es que la gente confunde los efectos de los algoritmos con los efectos de otra cosa. El otro punto por el cual creo que la influencia existe, pero no es tan grande, es que los fenómenos políticos y económicos son estratégicos, en el sentido de que dependen de lo que yo creo que los demás van a hacer, lo que vos creés que yo creo que vas a hacer. Eso explica por qué ahora, en épocas de Big data y algoritmos, no se pudieron predecir hechos gigantes como la victoria de Joe Biden. Había chances, pero no certezas. No sabemos quién va a ser nuestro presidente, no tenemos forma de saberlo. El problema no se resuelve con más datos o más algoritmos: son eventos esencialmente impredecibles, del mismo modo que es impredecible un partido de fútbol. No hay mejores predicciones ahora que hace 10 años, antes de los algoritmos.

-En “Tlon, Uqbar, Orbius Tertius”, Borges escribe que “el pasado no es menos plástico y dócil que el porvenir”. ¿Qué operación es más peligrosa? ¿La del algoritmo que quiere leer el futuro o la de leer el pasado en función de lo ya sucedido y buscar datos que confirmen lo que ya pasó?

-Las dos cosas. En varios textos, en “Tlon…”, en “Kafka y sus precursores”, la lectura del pasado no es ajena al presente. Una de las cosas con las cuales juega Borges es cuando dice que, para que aparezcan los precursores de Kafka, primero tengo que leer a Kafka. Las dos cosas son igual de peligrosas, porque a la larga muchísimo de ese relato no deja de ser contrafáctico. Suponete que nosotros concluimos que la cuarentena fue exitosa. Eso tiene un componente fáctico, lo que pasó y lo que dejó de pasar, pero también tiene un componente contrafáctico de que eso pasó, independientemente de otros factores que fueron concurrentes. Si bajé de peso, mi nutricionista va a decir que es gracias a él, pero mi psicólogo va a decir que fue gracias a él. La lectura del pasado no deja de ir “del chorizo al chancho”, no deja de haber un relato.

*Esta nota fue escrita por un periodista de la redacción de DEF.

LEA MÁS