¿Pueden los algoritmos superar los sesgos?

Por Ne0bi0 @buenosviajeros

Cualquier ciudadano del mundo con una conexión a Internet tiene acceso, de forma casi gratuita, a varios zetabytes de información. No hay duda de que esto ha cambiado el mundo, la forma de relacionarnos y la sociedad en si misma. Vivimos en una etapa caracterizada por la aparición de una riqueza generada a partir de los datos -que muchas veces cedemos sin saberlo- y de sistemas capaces de explotarlos de forma automatizada. No solo eso, sino que cada vez hay más sistemas que dan soporte a la toma de decisiones o, directamente, las toman. Sin embargo, el control (ya sea legal o social) sobre los algoritmos que usan esos sistemas es escaso.

Con la rápida adopción de sistemas basados en inteligencia artificial (IA) en todos los sectores nuestra vida, incluso en áreas tan sensibles como la salud, la seguridad y la justicia; la sociedad, los tecnólogos y algunos responsables políticos han expresado su preocupación por la falta de responsabilidad identificable y el sesgo asociado a las decisiones basadas en algoritmos de IA. No hay que olvidar que la IA resulta de tanta calidad como los datos con los que se entrena, en muchos casos plagados de prejuicios (humanos) preexistentes a nivel individual o social

Instagram y TikTok son redes con una velocidad y amplitud de difusión muy altas, lo que genera una mayor dificultad para mantener comunidades

Ahora bien, los sesgos no vienen sólo de los datos. También los algoritmos tienen sesgos. El caso más conocido es el de los algoritmos de linealización que intentan ajustar un conjunto de datos a una línea recta, aunque no lo sean. Uno de ellos es l a difusión del feed (el contenido que se ve nada más entrar a nuestro perfil) de las redes sociales como Facebook, Instagram, YouTube, Twitter o TikTok y es particularmente interesante porque afecta a la difusión de la información y por ende a la creación de opinión. A grandes rasgos el proceso es el mismo en todas las plataformas: las contribuciones (posts) de los usuarios se difunden a su grupo de conexiones y, si tienen éxito -es decir, si consiguen likes y shares-, su difusión traspasa el grupo de sus conexiones y alcanza porciones cada vez mayores de la red. En la medida que el entusiasmo por el post disminuya, así lo hará también su difusión.

No obstante, todos apreciamos diferencias más que notables entre las diferentes redes. Hablamos de influencers en Instagram y TikTok, y de youtubers en YouTube llegan a tener millones de seguidores, algo que es mucho menos común en Facebook o Twitter. Por contra, todos conocemos los cuasi grupos de opinión en Facebook en los que se apoyan normalmente líderes populistas, las cámaras de eco ( echo chambers). Un ejemplo de estas diferencias lo encontramos en Eliza, una chica de 17 años que el pasado verano experimentó pequeños pero incontrolables tics producidos por el síndrome de Giles de la Tourette y decidió subir varios vídeos a TikTok con el tag #tourettes. El resultado: más de tres billones de visualizaciones.

El principal problema del sesgo de difusión es su falta de transparencia: si lo consumimos, no podemos ser conscientes de que nuestra visión del mundo está segmentada

El hecho de que alguien prácticamente desconocido se convierta de la noche a la mañana en una celebridad a través de una red social como TikTok no es algo raro. Sin embargo, en Twitter va a ser muy difícil acceder a una parte substancial de la red, más allá de los contactos, sin hacer publicidad. Los elementos clave en esta capacidad de difusión son la velocidad y la amplitud, en particular, cuando se traspasa la barrera de los propios contactos. A modo de ejemplo, este enlace de TikTok da una descripción más detalla de su algoritmo.

Tanto esta red social como Instagram tienen una velocidad y amplitud de difusión altas. Son redes que reaccionan con rapidez, capaces de crear celebridades casi al instante y efímeras, pero con una mayor dificultad para mantener comunidades, grupos de usuarios que reciban información que mayoritariamente proviene de sus conexiones. Por el contrario, si es difícil traspasar la barrera de las propias conexiones, nos encontraremos dentro de unas cámaras de eco donde nuestra visión del mundo es compartida por personas que piensan de forma semejante. Entre ambos extremos se sitúan el resto de redes sociales.

¿Dónde esta el problema?

El primer problema de este tipo de sesgo de difusión es su falta de transparencia. Si estamos en estas redes no vamos a ser conscientes de que nuestra visión del mundo está sesgada por su algoritmo de difusión. Es decir, no vemos el mundo como es, sino como el algoritmo nos lo presenta. Esto tiene obvias implicaciones políticas, ya que puede facilitar la manipulación de la opinión de grupos, especialmente si éstos son cámaras de eco. Más aún si se añaden otros sesgos como el de confirmación -la tendencia a interpretar nueva evidencia como confirmación de las creencias o teorías existentes-, que hace que demos más valor a aquella opiniones con las que estamos de acuerdo, o el de veracidad -creer que las personas que nos rodean son honestas y que por ende son sinceras y dicen la verdad- por el que, de entrada, juzgamos los mensajes como honestos.

Un segundo problema se encuentra en los objetivos subyacentes de las redes sociales cuando eligen uno u otro método. Lo que queda claro es que se trata de capturar nuestra atención y nuestra fidelidad a fin de hacer posible y eficiente su modelo de negocio basado en la publicidad.

El tercer problema radica en el control. Los algoritmos de feed y personalización dinámicos se modifican en base a modelos experimentales que los orientan la optimización de la captura de la atención (maximizar el tiempo de permanencia en la red) y la fidelización de los usuarios. Como último apunte, podemos pensar que éste es un problema propio de las redes sociales, p ero cualquier algoritmo de recomendación o personalización orienta un feed, lo que lo convierte en una cuestión que afecta a prácticamente todo lo que tiene lugar en internet.

Esteve Almirall es profesor de Operaciones, Innovación y Data Science en Esade. Ulises Cortés es catedrático de Inteligencia Artificial en la Universitat Politècnica de Catalunya.

La entrada ¿Pueden los algoritmos superar los sesgos? se publicó primero en Ethic.