¿Que es la Anonimización? Explicación sencilla sin rollos jurídicos.

Publicado el 24 julio 2018 por Dataprius Sl @dataprius

La Anonimización es la nueva palabra que tenemos que asimilar tras la entrada en vigor del Reglamento General de Datos (RGPD) el pasado 25 de Mayo de 21018.

¿Qué significa? ¿Cuál es el concepto?

Cualquiera que busque la nueva palabreja se va a encontrar con que todas las definiciones hacen referencia al RGPD. Todo inmerso en textos jurídicos con poca claridad, incluso nos llevan a pensar que no se comprende.

La anonimización existe en el mundo de los sistemas informáticos cuando muchos de los abogados que han escrito sobre la palabra aún iban al colegio. No es un término nuevo aunque si es verdad que se ha puesto en uso por su aparición en las normativas de protección de datos.

Anonimización no aparece en el diccionario de la RAE

Lo primero a destacar es que la palabra no aparece definida en el diccionario de la Real Academia de la Lengua Española (http://dle.rae.es).

Lo que si aparece es una definición muy buena de Anonimizar:

El primer ejemplo. Como anonimizaron las notas de los estudiantes.

Fuera de contextos legales e incluso informáticos hay ejemplos para entender de forma sencilla que es esto de la Anonimización.

Cuando yo era estudiante de Ingeniería en Informática en la Universidad de Málaga las notas de los alumnos se publicaban en tablones. Las notas, eran listados de los alumnos que se habían presentado a un examen, se mostraban los nombres y los apellidos de esos alumnos junto con la nota obtenida en el examen.

Cualquier alumno, e incluso cualquiera que pasara por el pasillo dónde estaba el tablón, podía ver las notas obtenidas por sus compañeros.

Un tiempo después, algunos alumnos protestaron porque esta forma de publicar su calificaciones vulneraba su privacidad. Surgió entonces la necesidad de la Anonimización de las notas publicadas.

¿Cómo se hizo? Pues sencillamente dejaron de publicar listados dónde aparecían los nombres y se sustituyeron por sus DNI.

Ahora para identificar a un alumno y saber sus notas deberemos conocer su DNI. Identificar a una persona se hace bastante más difícil.

Podemos ya extraer algunas conclusiones sencillas.

La anonimización de los datos depende mucho del contexto y de la exposición pública que tengan dichos datos. Si la universidad hubiese optado por enviar las notas por correo no hubiera hecho falta pensar en esta solución. Si hoy en día los alumnos acceden de forma privada a la web de la universidad con sus claves entonces sus datos están protegidos de otra forma.

Otro ejemplo. Ocultando datos de los compradores de acciones en bolsa.

Una práctica que lleva años usándose en Agencias de Valores. Se trata de ocultar los datos de los clientes cuando se imprimen sus documentos.

En aquellos documentos que son imprimidos y que circulan por las oficinas de la empresa, en lugar de figurar los datos personales de los clientes se coloca un código de barras que identifica al cliente.

Algunos empleados, que tienen acceso a la información, disponen de un lector de códigos de barras conectado a su ordenador. De esta forma pueden identificar a que cliente corresponde el documento.

La anonimización en el mundo de las aplicaciones

Como hemos visto, ocultar los datos depende de la exposición pública que tengan estos datos.

Cada caso es diferente y cada sistema debe aportar soluciones específicas. Resulta imposible pensar en que Facebook hace una anonimización de sus usuarios, en cierto modo las redes sociales se benefician del hecho de que las personas son “cotillas” por naturaleza.

En los sistemas informáticos hay otros niveles dónde se deben ocultar los datos. Una cosa que si debe hacer Facebook es ocultar los datos de las personas en el lugar dónde se almacenan estos datos. Los sistemas suelen almacenar la información en Bases de Datos. Si un hacker o un usuario tuviera acceso a esa base de datos entonces tendría toda la infomación de todas esas personas.

Lo que se hace es que los datos se almacenan encriptados, cuando el programa o la aplicación necesita mostrarlos entonces se desencriptan.

Por desgracia servicios muy populares como Dropbox no habían practicado este tipo de ocultación cuando fueron hackeados. Esto ocurrió con Dropbox (Dropbox hackeado). Otro caso muy sonado fue el de Ashley Madison. Si los datos de los usuarios hubiesen estado debidamente anonimizados nada de esto hubiera pasado. Resulta que en estos dos casos hasta las claves de los usuarios se estaban almacenando sin encriptar.

La anonimización de los documentos en la empresa.

Tenemos claro que la necesidad de ocultar los datos depende del nivel de exposición que podrían tener estos datos.

Hablemos ahora de las aplicaciones en la Nube y en concreto de las que almacenan archivos.

Anonimizar es necesario cuando los datos se exponen. Si limitamos la exposición de los datos entonces estamos reduciendo la necesidad de ocultarlos. Una aplicación que solicita claves de acceso ya está en cierto modo ocultando información y garantizando que solo la ven los que tengan acceso.

La conclusión lógica es que si queremos ahorrarnos problemas de anonimización exigida por las normativas de protección de datos, entonces deberíamos tener controlado el acceso y la exposición de los datos.

Llegados a este punto podemos plantear un pregunta sobre el almacenamiento de archivos en la Nube.

¿Es posible la anonimización con aplicaciones populares como Dropbox o Drive?

La respuesta es No. El problema de estas plataformas es que son sincronizadores, esto significa que hacen copias de los archivos en todos aquellos ordenadores y dispositivos que son utilizados por los usuarios de la aplicación. Resulta imposible para una empresa u organización mantener el control de todos los dispositivos en casa, en portátiles o en cualquier lugar desde el que los usuarios se conectan al sistema.

Alguien podría decir que la solución está en cifrar los archivos que se guardan en la Nube, esto no es práctico, en el trabajo diario con documentos no podemos estar cifrando y descifrando continuamente estos archivos, no es práctico y consume tiempo de trabajo.

Nuestro sistema Dataprius nació con muchas características que lo hacen viable para entornos de protección de datos incluso cuando las normativas no eran tan duras. Por eso no es un sincronizador.

Muchas empresas se enfrentan hoy en día al problema de ocultar los datos de los usuarios, el problema parte de que usan software que nunca fue pensado para esto, en la mayoría de los casos son servidores locales en los que una vez obtenido acceso se puede extraer la información. La migración a sistemas en Cloud eliminará el problema, mientras tanto muchos se tendrán que romper la cabeza pensando en soluciones.

La entrada ¿Que es la Anonimización? Explicación sencilla sin rollos jurídicos. se publicó primero en Blog de Dataprius..