OPINION

En defensa del INE y del Big Data: 10 preguntas sobre el estudio de movilidad

Te esperan 100.000€ si tu startup se dedica a la explotación del 'big data'
Te esperan 100.000€ si tu startup se dedica a la explotación del 'big data'

Ayer se publicó en el diario elpais.com un artículo titulado: “El INE seguirá la pista de los móviles de toda España durante ocho días”, al que seguía esta entradilla: “El Instituto Nacional de Estadística pacta con las operadoras realizar un estudio sobre movilidad empleando información anónima”. El cual provocó, durante todo el día, numerosas muestras de preocupación en las redes sociales y medios.

La noticia no es nueva, porque La Información ya publicó un artículo, hace casi seis meses, que contaba: “Después del acuerdo con El Corte Inglés, el INE negocia con las grandes 'telecos' para poder explotar sus bancos de datos”, especificando después: “Estudia la fórmula para acceder a los datos de movilidad de personas de los operadores y mejorar su información censal y de movimientos de turistas”.

Pero siempre que se habla de datos personales salta la alarma, por mucho que se advierta y se aclare que, en realidad, el INE no va a manejar sino ‘datos agregados’ (es decir, datos estadísticos). Por eso, como quiera que el miedo es muy humano, sobre todo el de las personas que no tienen idea de estas cosas, conviene, creo, hacer un esfuerzo de pedagogía para intentar tranquilizarnos todos un poco.

Es verdad que el INE remitió a los medios de comunicación, a media tarde de ayer, un breve “comunicado institucional” (de media página) para intentar aclarar el tema. Pero ni en su web ni en su cuenta de Twitter se dijo absolutamente nada durante 12 horas. Y, mientras tanto, las redes sociales, las redacciones de los medios y los teléfonos echaban chispas. Ha faltado, en este caso, transparencia y agilidad.

No obstante, más allá de los fallos en la comunicación, quiero romper una lanza en defensa del INE y, sobre todo, del Big Data, porque sería un gran error azuzar los miedos hacia esta tecnología y hacia la Inteligencia Artificial, cuando, bien usadas, pueden producir grandes beneficios, no sólo para la Economía Digital (o Economía del Dato o del Conocimiento), sino también para el interés general de la Sociedad.

¿Qué es un dato personal?

Según el Reglamento General de Protección de Datos de la UE (art. 4.1) es: “toda información sobre una persona física identificada o identificable”. Es decir, un dato ‘asociado’ a una persona con nombre y apellidos.

¿Qué es un dato seudonimizado?

Es un dato personal al que se le ha aplicado un tratamiento (disociación) de manera tal que ya no puede ‘atribuirse’ a una persona sin utilizar información adicional. Es decir, ya no es un dato personal, asociado a una persona, sino ‘disociado’ (art. 4.5).

¿Cuándo está bien seudonimizado un dato?

Cuando la ‘información adicional’ que sirva para re-identificar “figure por separado y esté sujeta a medidas técnicas y organizativas destinadas a garantizar que los datos personales no se atribuyan a una persona física identificada o identificable”.

¿Qué tipo de datos va a utilizar el INE en su estudio?

El INE no va a utilizar en su estudio datos personales (asociados a personas físicas identificadas o identificables), sino datos disociados. En este caso la disociación se produce por ‘agregación’ de datos, que es lo que ha hecho siempre la Estadística.

¿Puede hacerlo sin nuestro consentimiento?

Como ya no son ‘datos personales’ (asociados a personas físicas identificadas o identificables), sino datos disociados o ‘agregados’, el INE puede usarlos sin tener que pedirnos permiso. Aunque quisiera hacerlo, no sabría a quién pedírselo.

¿Se aplica el Reglamento General de Protección de Datos?

El RGPD no se aplica a la ‘información anónima’, es decir, la que no guarda relación con una persona física identificada o identificable, ni a los datos convertidos en anónimos, de forma que el interesado no sea identificable”. (Considerando 26)

¿Va a poder saber el INE dónde está cada uno de nosotros?

Como dice el INE en su comunicado institucional: “Los operadores no facilitarán datos individuales sobre números de teléfono, ni sobre los titulares de las líneas, por lo que en ningún caso el INE podrá rastrear la posición de ningún terminal”.

¿Para qué quiere el INE datos de geoposicionamiento de móviles?

Según el INE: “Está realizando un estudio a partir de datos de teléfonos móviles para incorporarlos a la información sobre movilidad que ofrece tradicionalmente en los Censos de Población y Viviendas”. Antes los realizaba mediante encuestas.

¿Corren peligro nuestros datos personales?

No corren peligro porque sencillamente en el estudio no se usan datos personales. Y aunque se utilizaran, como cuando el INE realiza encuestas, esos datos estarían sujetos al secreto estadístico, y no los puede ceder a terceros.

¿Hay peligro de que se puedan re-identificar a los titulares de los datos?

Aunque en tecnología nunca hay una seguridad del 100%, si se ha hecho bien la disociación, no debería haber ese riesgo. Pero, si en algún caso alguien lo lograra, sería una infracción al RGPD y, seguramente, un delito contra la intimidad.

Conclusión: El Big Data es la Estadística del Siglo XXI

No debemos temer que el INE utilice para sus estudios las tecnologías de Big Data y la Inteligencia Artificial, mucho más exactas que las tradicionales encuestas, sino que debemos felicitarnos por ello, porque el Big Data no es sino la Estadística del Siglo XXI y sólo gracias a su uso, con todas las garantías para los derechos de los ciudadanos, podremos evaluar y mejorar las políticas públicas.

Mostrar comentarios