Te conozco, desde el pelo hasta la punta de los pies

Datos: filtraciones y protección.

Hola, ¿cómo estás? Sí, ya sé.

El otro día circuló este meme, que es una versión aumentada (o pandemizada) del original. 

Es muy difícil todo, así que solo me permito recomendarte que cuides y cultives esos espacios y momentos que te permiten aflojar con las preocupaciones por un rato. Para mí, en estos días, fue escuchar música, cantar y bailar. Claro que, cuando termina el tema, el mundo sigue ahí, pero quién te quita lo bailado. 

Pasado este momento energético, metamos la cabeza en el tema de hoy: datos.

Voy a hablar de este tema teniendo como disparador este documento de Fundar sobre anonimización de datos. Fundar es una organización muy jovencita dedicada al estudio y al diseño de políticas públicas en Argentina. Quizás ya lo sabés, pero por las dudas te cuento que Cenital y Fundar ahora son aliados. Me gusta la alianza porque creo que para que haya resultados nuevos hay que hacer cosas nuevas. Acá y acá podés leer más al respecto.

En Cenital nos importa que entiendas. Por eso nos propusimos contar de manera sencilla una realidad compleja. Si te gusta lo que hacemos, ayudanos a seguir. Sumate a nuestro círculo de Mejores amigos.

Entonces: datos. Todo el tiempo le damos todos nuestros datos a todo el mundo. La otra vez vi un tuit de alguien que contaba que había comprado soda y le habían pedido una cantidad de información (lo obvio es dirección y teléfono, pero también DNI, fecha de nacimiento y correo electrónico), se había quejado y le habían aceptado que diera solo pocos datos. Contesté en chiste que se iba a perder la soda de regalo el día de su natalicio, pero el tuit es ilustrativo. Para cada cosa que hacemos en este mundo en estos días hay que proporcionar una serie amplia de información. Claro que el sodero del barrio seguramente no haga nada con ellos y la cosa quede ahí, pero ¿qué pasa con las grandes empresas que concentran una enorme cantidad de información nuestra?

Pasan dos cosas. Por un lado, que son absolutamente irresponsables en su condición de almacenadores. Hace pocos días Facebook reveló otra vez que había filtrado una gran cantidad de información de sus usuarios. En concreto, se hicieron públicos datos como el nombre de perfil, el número de ID en la plataforma, la dirección de mail, y el número de teléfono de 533 millones de personas. El regalo es que toda esta data viene junta y es un banquete para los que se dedican al fraude electrónico. Leí la noticia y pensé: “Nosotros rompiéndonos la cabeza para poner una contraseña distinta para cada cosa y estos revelando nuestra información cada dos por tres”. 

(Dije lo de poner contraseñas distintas para parecer una persona del 2021, pero lo cierto es que tengo la misma contraseña básica para casi todo, excepto correos electrónicos y bancos. El otro día estaba ayudando a mi viejo a armarse una cuenta en Amazon. “¿Qué contraseña ponemos?”, le pregunté. Su respuesta me hizo sentir una analfabeta digital: “Hagamos como vos decís y usemos la misma de siempre”. ¿Quién se acuerda de todas las contraseñas? Sí, hay apps para manejar las contraseñas, pero lo urgente y lo importante…)

En el caso más reciente que te cuento de Facebook, lo interesante fue que, como ha habido tantas “sueltas” de datos, no se entendía bien a cuál de todas correspondía ésta. ¿Eran nuevos o viejos datos? Si hacemos memoria, resulta que Facebook filtró datos en abril de 2019 (540 millones de personas); en algún otro momento antes de 2018 (419 millones de usuarios); en el escándalo de Cambridge Analytica también en 2018; y otra vez en el mismo año cuando filtró toda la información personal de 30 millones de usuarios. Nótese que en esta apurada lista yo combino cosas que parecen ser accidentes (aún con negligencia) con acuerdos explícitos (como fue lo de Cambridge Analytica). Pero, al parecer, este último es un evento nuevo y tiene que ver con la explotación por parte de un tercero de un problema en el sistema para importar contactos en Facebook. La empresa lo arregló en agosto 2019, pero no sabemos cuántas veces antes de eso hubo filtraciones. Y obviamente Zuckerberg no se sienta a charlar y contar cómo se le pierden datos tres veces por año. 

Hasta acá lo que pasa cuando las empresas no se preocupan lo suficiente por proteger nuestros datos. Pero, por otro lado -y aquí quizás venga lo más interesante-, aún cuando las empresas son sumamente cuidadosas con los datos, los protegen e incluso trabajan para que las personas no puedan ser identificadas, las cosas fallan.

En el documento de Fundar que te enlacé arriba, Daniel Yankelevich analiza precisamente esto: lo difícil que es lograr la anonimización. Para eso arranca con algunas anécdotas que explican cómo gente que sabe puede identificarte perfectamente tan solo a partir de tres datos: fecha de nacimiento, código postal y género. O sea, alguien trabaja en una base de datos gigante, borra o encripta casi toda la información menos esos tres datos y, otras personas, usando otros registros (por ejemplo, electorales), pueden reconstruir muchísima información sobre vos. El documento proporciona otros ejemplos de intentos fallidos de preservar información personal (y uno muy divertido que involucra a Netflix).

Como esto es un problema tan común, algunos organismos públicos y privados que tienen datos intentan esconder la información. Por miedo a lo que puede pasar, los datos no se difunden o se agrupan de modo que no son útiles para el análisis posterior y se pierde entonces su riqueza. El documento propone otra estrategia: trabajar de frente con esos datos y explotarlos al máximo. 

Este punto que hace el documento me parece particularmente interesante. Para saber más, para pensar políticas, para evaluarlas, los datos son importantísimos. Acceder a ellos y entender cómo trabajarlos es clave. Se trata de aprender a usarlos para poder explotarlos.

Para eso, el documento propone cuatro pasos: identificar datos, identificar riesgos, identificar soluciones, identificar ataques y problemas. El primer punto refiere a tener consciencia de que esta no es la única base de datos que existe (hay otras con las que puede ser cruzadas) y también saber cuál es el ciclo de vida de los datos. O sea, tener claro de qué datos se trata. El segundo punto, identificar los riesgos, quiere decir imaginar los peores escenarios posibles que pueden generarse a partir de esos datos. El tercero, identificar soluciones, se refiere a pensar cómo lidiar con estos datos de manera efectiva. Si bien la anonimización completa es casi imposible (además de muy costosa), hay técnicas que se acercan. El cuarto y último, identificar ataques y problemas, trata precisamente de testear el sistema: ver qué puede pasar, cómo se resolvería, qué recursos y fallas tenemos.

El documento termina con un conjunto de buenas prácticas y vuelve a repetir: esconder o no compartir los datos es la peor opción porque perdemos todos. Digamos que tener datos es un gran poder y conlleva una gran responsabilidad. Y hay que estar a la altura. 

Una idea

Si te interesa todo esto, te sugiero leer el documento. Agrego una cosa más que me pareció interesante: todo esto está siendo desarrollado ahora. Hay muchísimo por pensar y probar, y este trabajo de Fundar nos permite verlo de cerca. 

El del estribo

Siguiendo con el tema de los datos y Facebook, dos notas al respecto. Irlanda investiga a la empresa por la última filtración y Alemania por la posibilidad de que la red social y WhatsApp compartan datos en la UE. 

Cosas que pasan

Gracias por llegar hasta acá.

Un abrazo,

Jimena

PD: Desde hace meses recibo en mi casilla varios de los newsletters de Cenital, y ahora estoy (también) del otro lado. Si tenés ganas, podés colaborar con nuestro periodismo acá. Y, si todavía no lo hiciste, te recomiendo que te sumes al canal de Telegram que lanzó Cenital.

Soy economista (UBA) y Doctora en Ciencia Política (Cornell University). Me interesan las diferentes formas de organización de las economías, la articulación entre lo público y lo privado y la relación entre el capital y el trabajo, entre otros temas. Nací en Perú, crecí en Buenos Aires, estudié en Estados Unidos, y vivo en Londres. La pandemia me llevó a descubrir el amor por las plantas y ahora estoy rodeada de ellas.