Revista Salud y Bienestar

Quiero tus datos (anonimizados) de los medios de comunicación social

Por David Ormeño @Arcanus_tco

por Anthony Sanford

Las respuestas de los sitios de medios sociales al escándalo de Facebook-Cambridge Analytica y a las nuevas normas europeas de privacidad han dado a los usuarios mucho más control sobre quién puede acceder a sus datos y para qué fines. Para mí, como usuario de medios sociales, estos son desarrollos positivos: Da miedo pensar lo que estas plataformas podrían hacer con los trozos de datos disponibles sobre mí. Pero como investigador, me preocupan las crecientes restricciones sobre el intercambio de datos.

Soy uno de los muchos académicos que dependen de los datos de los medios sociales para obtener información sobre las acciones de la gente. En un apuro por proteger la privacidad de las personas, me preocupa que una víctima involuntaria pueda ser el conocimiento de la naturaleza humana. Mi trabajo más reciente, por ejemplo, analiza los sentimientos que la gente expresa en Twitter para explicar por qué el mercado de valores fluctúa tanto en el transcurso de un solo día. Hay aplicaciones que van mucho más allá de las finanzas. Otros académicos han estudiado la satisfacción de los usuarios de transporte público, la función de los sistemas de alerta de emergencia durante los desastres naturales y cómo las interacciones en línea influyen en el deseo de la gente de llevar estilos de vida saludables.

Esto plantea un dilema, no sólo para mí personalmente, sino para la sociedad en su conjunto. La mayoría de la gente no quiere que las plataformas de medios sociales compartan o vendan su información personal, a menos que el usuario individual lo autorice específicamente. Pero como miembros de una sociedad colectiva, es útil entender las fuerzas sociales en el trabajo que influyen en la vida cotidiana y las tendencias a largo plazo. Antes de las crisis recientes, Facebook y otras empresas ya habían estado dificultando a los investigadores legítimos el uso de sus datos, entre otras cosas dificultando y encarecendo la descarga y el acceso a los datos para su análisis. La renovada presión pública por la privacidad significa que es probable que se endurezca aún más.

Uso de los datos de las redes sociales en la investigación

Definitivamente es alarmante considerar la posibilidad de que la gente o las compañías analicen mis datos y encuentren maneras de influenciarme para que tome decisiones que de otra manera no tomaría, o que son incluso contrarias a mis propios intereses. Sólo necesito pensar en el número de veces que he visto un anuncio de televisión de pizza durante un evento deportivo y he pedido una pizza.

Ese es el punto del marketing, por supuesto - pero los medios sociales son diferentes porque la información es sobre mí específicamente. Y usar esa información puede afectar mucho más que los alimentos que compro, como por ejemplo por quién voto. Sin embargo, como investigador en finanzas, también reconozco que los mismos datos pueden ser utilizados para ayudarnos a entender comportamientos colectivos que de otra manera serían imposibles de explicar.

Algunas de mis investigaciones, por ejemplo, exploran las tendencias a corto plazo de los precios de las acciones. Los expertos financieros han descubierto que, a largo plazo, las cotizaciones bursátiles de una empresa están determinadas por su valor futuro. Sin embargo, en el transcurso de un solo día, los precios de las acciones pueden variar ampliamente. Muchos investigadores y analistas financieros le dirán que estos movimientos son ruido sin sentido, información aparentemente aleatoria sobre compañías que influyen en las percepciones de los inversores y hacen que los precios de las acciones varíen constantemente.

Pero analizando los datos de los medios sociales, puedo entender realmente qué es ese ruido, de dónde viene y qué significa. Por ejemplo, lo que la gente escriba en Twitter sobre el nuevo iPhone afectará al precio de las acciones de Apple, a veces en cuestión de minutos, pero incluso en el transcurso de días. La velocidad del efecto depende de la importancia o prominencia de la persona que envía el tweet, así como de la rapidez con la que otros - incluyendo los medios - captan el mensaje.

Los resultados de mi investigación pueden ayudar a los inversores a ajustar cuándo y cómo entran en el mercado. Si, por ejemplo, los usuarios de medios sociales creen que el iPhone más nuevo no será tan bueno como se esperaba, los inversores podrían retener su inversión en acciones de Apple. Eso podría liberarlos para que invirtieran en otra cosa con mayor entusiasmo, con la esperanza de obtener mayores beneficios.

Anonimización de datos

Es cierto - y preocupante - que algunas personas presumiblemente poco éticas han tratado de usar los datos de los medios sociales para su propio beneficio. Pero los datos no son el problema real, y cortar el acceso de los investigadores a los datos no es la solución. Hacerlo también privaría a la sociedad de los beneficios del análisis de los medios sociales.

Afortunadamente, hay una manera de resolver este dilema. La anonimización de los datos puede mantener intacta la privacidad individual de las personas, a la vez que proporciona a los investigadores acceso a datos colectivos que pueden aportar importantes conocimientos.

Incluso existe un modelo sólido para lograr ese equilibrio de manera eficiente: la Oficina del Censo de los Estados Unidos. Durante décadas, esa agencia gubernamental ha recopilado datos extremadamente personales de hogares de todo el país: edades, situación laboral, niveles de ingresos, números de Seguro Social y afiliaciones políticas. Los resultados que publica son muy ricos, pero tampoco trazables a ningún individuo.

A menudo es técnicamente posible revertir las protecciones de anonimato en los datos, utilizando múltiples piezas de información anónima para identificar a la persona con la que todos se relacionan. La Oficina del Censo toma medidas para prevenir esto.

Por ejemplo, cuando los miembros de los datos censales de acceso público, la Oficina del Censo restringe la información que es probable que identifique a individuos específicos, como por ejemplo, informar que sólo hay una persona en una comunidad con un nivel de ingresos particularmente alto o bajo.

Para los investigadores el proceso es algo diferente, pero proporciona protecciones significativas tanto en la ley como en la práctica. Los becarios deben aprobar el proceso de investigación de la Oficina del Censo para asegurarse de que son legítimos y deben recibir capacitación sobre lo que pueden y no pueden hacer con los datos. Las sanciones por violar las reglas incluyen no sólo la prohibición de utilizar los datos del censo en el futuro, sino también multas civiles e incluso el enjuiciamiento penal.

Incluso entonces, lo que los investigadores obtienen viene sin un nombre o número de Seguro Social. En cambio, la Oficina del Censo utiliza lo que llama " claves de identificación protegidas", un número aleatorio que reemplaza los datos que permitirían a los investigadores identificar a los individuos.

Los datos de cada persona se etiquetan con su propia clave de identificación, lo que permite a los investigadores vincular información de diferentes tipos. Por ejemplo, un investigador que desee hacer un seguimiento del tiempo que tardan las personas en completar un título universitario podría seguir los niveles de educación de las personas a lo largo del tiempo, gracias a las claves de identificación.

Las plataformas de medios sociales podrían implementar un proceso de anonimización similar en lugar de aumentar los obstáculos - y el costo - para acceder a sus datos. Podrían asignar números de identificación de los usuarios en lugar de compartir sus identidades reales, y podrían estar de acuerdo con las regulaciones gubernamentales que definen quién puede tener acceso a qué datos, incluyendo sanciones reales por violar las reglas. Entonces los investigadores podrían descubrir las perspectivas que ofrece el uso de los medios sociales, al igual que lo hacen con los datos del censo, sin amenazar la privacidad de las personas.

Traducción realizada con el traductor http://www.DeepL.com/Translator


Volver a la Portada de Logo Paperblog