Revista Salud y Bienestar

Visualización de datos: retos y mitos.

Por David Ormeño @Arcanus_tco
Visualización de datos: retos y mitos.

Aaron Koblin en su conferencia TED "Visualizando nuestra humanidad artísticamente" manifestó que el siglo XXI estará definido como el siglo de la interfaz, en similitud al impacto que tuvo el cine en siglo XX, o la novela en el siglo XIX. Y realmente está siendo así, ya que por ejemplo consumimos información multi dispositivo (tableta, smartphone, PC , TV....) y además con la ingente cantidad de datos generados, empresas de servicios de visualización como Platfora, Datameer, o plataformas con interfaces de visualización basados en el navegador como Clearstory y Chartio son claros ejemplos de que la visualización de datos goza de buena salud, y no ha hecho más que despegar.

Además si estamos un poco avezados en la programación, y nos atrevemos a trastear con el códigodisponemos de diversas herramientas, como por ejemplo las librerías de JavaScript, tipo D3.js, Raphaël o Paper.js, que aprovechando las funcionalidades tipo Canvas y SVG de los navegadores nos facilitan mucho la producción de visualizaciones de datos complejas, que hasta hace poco eran área específica y exclusivas de programadores avanzados. Aunque todo parece fácil y fascinante, en mi opinión hay algunos puntos que merece la pena tener en cuenta antes de crear una visualización de datos,y que rompen algunos de los mitos.

Aunque David Mccandless asegura en su famoso libro que la información es bella, los datos en crudo son feos y debemos trabajar con ellos para darles forma. La mayoría de los tutoriales de visualización de datos nos ofrecen conjuntos de datos o datasets, estructurados y limpios. Pero en la práctica en la mayoría de los conjuntos de datos que nos encontremos en el mundo real, consumiremos casi el 80% de nuestro tiempo para crear una visualización, en la exploración, adquisición, carga, limpieza y transformación de datos. Además aunque dispongamos de herramientas automatizadas para la limpieza de los conjuntos de datos como por ejemplo Google Refine, siempre requieren un nivel de trabajo manual en la limpieza y transformación de los datos.

Otro de los mitos a explorar cuando empezamos con la visualización de los datos es que los gráficos de barras son aburridos, y realmente no es así ya que muchas veces son la mejor opción. Cuando empezamos a trabajar en visualización de información y datos siempre queremos ser creativos y buscar visualizaciones efectivas como el informe Digital Life de TNS. Queremos huir rápidamente de los "aburridos" gráficos de barras ya que en comparación con los gráficos de barras, los gráficos de burbujas por ejemplo facilitan más puntos de datos en menos espacio, los gráficos de anillos indican claramente las relaciones parte-todo, y los diagramas de árbol muestran fácilmente las categorías jerárquicas. Pero si aprendemos sobre psicología de la percepción veremos claramente que ninguno de ellos es más efectivo que una simple gráfico de barras para una comparación fina entre valores. El hecho que dispongamos de herramientas y formas de visualización visualmente atractivas , no quiere decir que sean las más efectivas siempre. Debemos pensar siempre en facilitar la comprensión sin distorsión de los datos facilitados no debemos caer lo fashion o "eye candy". Los gráficos de barras son una de las mejores herramientas disponibles para facilitar las comparaciones visuales, aprovechando nuestra capacidad innata para comparar con precisión longitudes que están una al lado de la otra. Un buen ejemplo de esto sería el gráfico "En qué gasta España" creado por la Información, donde podemos comparar de forma interactiva en qué partidas se gasta el presupuesto general del Estado.

Un último mito a reflexionar es que la visualización no es el análisis. Es importante recordar que la visualización es una herramienta para ayudar al análisis y no un sustituto de la habilidad analítica. Tampoco es un sustituto de las estadísticas: el gráfico puede resaltar las diferencias o correlaciones entre los puntos de datos, pero para sacar conclusiones de forma fiable sobre percepciones a menudo requeriremos de un enfoque estadístico más riguroso. Un claro ejemplo de esto es el Cuarteto de Anscombe que demuestra que cuatro conjuntos de datos que tienen las mismas propiedades estadísticas, son distintos al inspeccionar sus gráficos respectivos. No esperemos que las visualizaciones de datos, y más si estas se basan en herramientas gratuitas online con plantillas, nos hagan todo el trabajo de forma automática. El éxito de una visualización, se basa entre otras variables, en comprensión de nuestros datos que por lo general requiere una combinación de habilidades de análisis , estadística y cierto experiencia en la limpieza de datos.

Fuente: Seven Dirty Secrets of Data Visualization


Volver a la Portada de Logo Paperblog