Estoy intentando profundizar en el concepto y, sobre todo, técnicas y estado del arte del Process Mining que se puede entender, dicho de forma simplificada, como la aplicación de Data Science a los procesos de negocio. Y con esa idea he iniciado la lectura de 'Process Mining. Data Science in action' de Wil van der Aalst.
Y, nada más empezar, y aunque sea en términos muy sencillos, me he encontrado, todavía referido a Data Science como tal, no aún específicamente a Process Mining, con un par de detalles muy interesantes, por clarificadores.
Lo primero, una definición sencillísima de lo que es Data Science:
Data Science is an interdisciplinary field aiming to turn data into real value
Una definición que me gusta porque, por un lado es absolutamente simple y fácil de comprender (aunque quizá no desvele del todo de qué estamos hablando) y lo segundo por el énfasis que pone en la aplicación práctica a problemas reales para 'sacarle jugo' a los datos.
Y el segundo detalle que me he topado nada más empezar son las cuatro categorías de preguntas a que se deben responder con Data Science y que son estas:
- Informe: '¿Qué ha sucedido?'
- Diagnóstico: '¿Por qué ha sucedido?'
- Predicción: '¿Qué sucederá?'
- Recomendación: '¿Qué es lo mejor que puede suceder?'