Revista Informática

¿Qué es Small Data?

Publicado el 21 septiembre 2018 por Daniel Rodríguez @analyticslane

En el año 2016 el gurú del comportamiento del consumidor Martin Lindstrom publicó el libro "Small Data: Las pequeñas pistas que nos advierten de las grandes tendencias". Convirtiéndose en uno de los libros más vendido del año y llegando a ser Bestseller del New York Times. Gracias a la popularidad obtenida por el libro también se popularizo el termino "Small Data" (datos pequeños). En el libro, mediante la utilización de ejemplos, explica la metodología desarrollada para comprender los deseos y necesidades ocultas de los consumidores. Pudiendo así crear nuevos productos o servicios que puedan cubrir estas necesidades. La implementación de esta metodología que no requiere la utilización de grandes conjuntos de datos ("Big Data"), sino que analiza los patrones en pequeñas muestras.

Es habitual encontrar que el término "Small Data" se tiende a utiliza como contraposición de "Big Data". Aunque es lo que se puede deducir del nombre esto es erróneos. Ya que ambas técnicas de análisis de datos son complementarias. La utilización de algoritmos de aprendizaje automático ( Machine Learning) en grandes conjuntos de datos permite obtener modelos que pueden explicar el comportamiento de los clientes. Por otro lado, nada impide utilizar pequeños conjuntos de datos o casos específicos para analizar y comprender el comportamiento y deseos de los clientes. Pudiendo obtener información complementaria mediante cada una de las metodologías. Mejorando así la comprensión de los clientes.

Definición de datos pequeños

En el blog Small Data Group se puede encontrar la siguiente definición de "Small Data":

Small Data conecta a las personas con perspectivas oportunas y reveladoras (derivadas del "Big Data" y/o de fuentes "locales"), organizadas y empaquetadas, a menudo visualmente, de forma que son accesibles, entendibles y procesables en las tareas de cada día.

Small Data Group

En esta definición indica cómo que los datos utilizados en análisis de datos pequeños pueden proceder tanto de conjuntos "Big Data", como ser obtenidos de otras fuentes diferentes. La característica que los diferencia es que pueden ser entendidos por personas. Siendo además innecesario utilizar grandes infraestructuras tecnológicas. Para lo que se ha de reducir el volumen de datos utilizado en el análisis.

¿Por qué utilizar "Small Data" en lugar de "Big Data"?

La utilización de un análisis datos pequeños puede ofrecer ventajas frente a "Big Data" en ciertas ocasiones. Por ejemplo, se puede enumerar:

  • El análisis de datos pequeños se encuentra disponible en todo momento sin la necesidad de capturar datos. Cualquier situación o evento puede ser analizada con esta metodología, sin la necesidad de obtener una cantidad de datos significativa.
  • La implementación de un análisis "Big Data" requiere tiempo y recursos que no son necesarios en "Small Data". La captura de los datos requiere un tiempo y recursos que en ciertas ocasiones pueden no estar disponibles.

Conclusiones

En esta entrada se ha visto que el término "Small Data" no es lo opuesto de "Big Data", sino que ambos son complementarios. La utilización de datos pequeños permite realizar análisis de datos cuando no existen datos para la construcción de un modelo. Permitiendo obtener conclusiones en situaciones que no son posibles mediante otro tipo de análisis.

Imágenes: Pixabay


Volver a la Portada de Logo Paperblog