Publicado por en
En una entrada anterior se ha visto qué es la minería de datos y para que se utiliza. En esta entrada se van a estudiar los posibles tipos de análisis en minería de datos.
Posibles análisis en minería de datos
En minería de datos se pueden realizar diferentes tipos de análisis, los cuales se pueden clasificar en base a su complejidad. Estos básicamente se pueden dividir en seis categorías, ordenados de mayor a menor complejidad, son:
- Descriptivos: descripción cualitativa de las principales características de los datos.
- Exploratorios: análisis de los datos en búsqueda de relaciones desconocidas.
- Inferenciales: evaluación de la validez de teorías en muestras de los datos.
- Predictivos: análisis de los datos presentes para obtener predicciones para ser utilizadas en la predicción de eventos futuros.
- Causales: estudia el efecto en una variable al cambiar otra.
- Mecanicistas: comprensión de los cambios que se produce en las variables y el efecto que producen en otras variables.
Análisis descriptivo
El análisis descriptivo es el más simple de todos, en este no se llega a crear un modelo en sí, pero los resultados obtenidos pueden ser utilizados para mejorar la compresión de los problemas planteados. Suelen ser el tipo de análisis que se realizan en las primeras fases de cara a aumentar la compresión de los datos disponibles.
Análisis exploratorios
Los análisis exploratorios son un paso más allá de los descriptivos, en estos ya se buscan relaciones entre los datos, pero estas no tienen por qué ser las respuestas directas a unos problemas de negocio. Mediante estos se pude llegar a comprender que dos variables están relacionadas, pero no obtener una fórmula que describa la forma exacta de esta relación.
Análisis inferenciales
En los análisis inferenciales ya se evalúan teorías. En estos casos se pueden comprobar las relaciones que existen entre las diferentes variables de las que se dispone en los conjuntos de datos.
Análisis predictivos
Los análisis predictivos son aquellos en los que los modelos resultantes se pueden utilizar para realizar predicciones en ocasiones futuras eventos. Mediante estos análisis es posible predecir cómo se comportará un cliente, el mercado o un sistema ante una situación dada y poder anticipar la respuesta más adecuada en función de las necesidades.
Análisis causales
Los análisis causales van más allá de las predicciones permitiendo relacionar las causas con los efectos y el grado en el que se afectan mutuamente. Este es un nivel de conocimiento mayor ya que no solamente se puede predecir el comportamiento de un cliente, el mercado o un sistema, sino que se pude identificar las caudas que llevan al mismo y actuar sobre ellas.
Análisis mecanicistas
Finalmente, el tipo de análisis más complejo son los mecanicistas en los que se puede llegar a comprender los cambios que producen unas variables en resto. Este es el análisis que menos se realiza ya que para alcanzar el mismo es necesario una compresión profunda de los procesos a modelar, lo que no siempre es posible.
Conclusiones
En esta entrada se han visto una categorización con los seis tipos de análisis que se utilizan en minería de datos. Ordenados de mayor a menor complejidad son: descriptivos, exploratorios, inferenciales, predictivos, causales o mecanicistas. La complejidad también indica la frecuencia con la que se utilizan, siendo menos utilizados los últimos.