Análisis de datos en Python al estilo Excel con Mito

Publicado el 15 noviembre 2021 por Daniel Rodríguez @analyticslane

Mito es una interfaz para el análisis de datos basaos en JupyterLab con un funcionamiento similar al de las hojas de cálculo. Permitiendo llevar a cabo complejos análisis en pocos segundos, creando además de forma automática código Python con el que repetir las operaciones en cualquier conjunto de datos similar. Lo que permite crear análisis de datos en Python al estilo de Excel.

Algunas de las operaciones que se pueden realizar con Mito de forma visual sobre cualquier conjunto de datos se incluye la unión, el filtrado, la ordenación, la visualización, el uso de fórmulas y la creación de tablas resumen.

Instalación de Mito

Para instalar Mito es necesario tener Python 3.6 o posterior y ejecutar en la terminal los siguientes comandos:

python -m pip install mitoinstaller
python -m mitoinstaller install

Una vez hecho esto se puede abrir JupyterLab y abrir Mito ejecutado en una celda las siguientes instrucciones:

import mitosheet
mitosheet.sheet()

En el caso de que ya se disponga de un DataFrame en memoria sobre el que se desee trabajar solamente hay que pasar este como parámetro a la función mitosheet.sheet(), en caso contrario se puede importar desde la propia herramienta cualquier archivo.

La mejor forma de ver cómo funciona esta herramienta y las ventajas que ofrece es mediante un video como el siguiente.

Como se muestra en el video, una vez realizadas todas las operaciones necesarias sobre el conjunto de datos se obtiene el código Python con los pasos. Incluyendo en este desde la carga de datos a las transformaciones más complejas. Lo que facilita la automatización de estos análisis. Así, en el caso de que sea necesario repetir estos el futuro con un conjunto de datos similar, solamente se tiene que copiar el código y apartarlo.

Conclusiones

En esta ocasión hemos visto Mito, una interfaz para el análisis de datos basados en JupyterLab con la que es posible llevar a cabo análisis de datos en Python al estilo de Excel. Con lo que se puede ahorrar mucho tiempo en las tareas diarias de análisis de datos, sin perder por ello la potencia que tiene Python.