Python es uno de los mejores entornos de trabajo que existen actualmente para los científicos de datos. Existen múltiples librerías con las que realizar de una forma sencilla y eficiente una gran cantidad de tareas, como pueden ser NumPy, Pandas, Matplotlib, Seaborn o Scikit-Learn. Aunque la importación de todas las dependencias necesarias en un proyecto puede llegar a ser una tarea algo tediosa. Especialmente cuando es necesario incluir decenas de líneas import
en el código. Algo que se puede evitar con Pyforest, un paquete que permite importar automáticamente las dependencias en Python utilizadas en la mayoría de los proyectos de ciencia de datos.
Instalación y uso básico de Pyforest
Pyforest se puede instalar desde PyPI escribiendo y ejecutando el siguiente comando
pip install pyforest
Una vez instalada la librería solamente se tendrá que importar está en un proyecto para tener disponible las principales librerías empleadas en ciencia de datos. Por ejemplo, se tiene acceso tanto a Pandas como a Seaborn, por lo que el siguiente código funcionará perfectamente.
import pyforest penguins = sns.load_dataset('penguins') penguins.head() sns.countplot(data=penguins, x="species")Recuento de especies en el conjunto de datos de Pingüinos de Seaborn
¿Qué librerías importa Pyforest?
El objetivo del paquete es facilitar la escritura de código por parte de los científicos de datos, por lo que incluye las típicas importaciones de las librerías más populares como puede ser pandas as pd
, numpy as np
, matplotlob.pyplot as plt
y seaborn as sns
. Lista que en la actualidad llega hasta las 80 importaciones que se puede consultar en el GitHub del proyecto.
Siendo posible agregar nuevas importaciones escribiéndolas en un archivo que se debe situar en la ubicación ~/.pyforest/user_imports.py
.
Consultar las librerías importadas
Para conocer las librerías que se han importado se puede recurrir a la función active_imports()
, la cual devuelve una lista con todas las importaciones activas. Así, si se necesita compartir el código con otros usuarios que pueden no tener instalado Pyforest se puede reemplazar la única importación por las que aparecen en esta lista. Evitando posibles problemas de incompatibilidad al ejecutar el código en otros entornos.
También existe una función para conocer todas las importaciones que no se ha utilizado lazy_imports()
.
Conclusiones
En esta ocasión se ha visto un paquete de Python con el que simplificar la importación de librerías en la mayoría de los proyectos de ciencia de datos. Al importar automáticamente las dependencias en Python solamente con una línea, evitando de esta manera una tarea que puede ser tediosa. Esto sin perder el control de lo que se importa, ya que mediante la función active_imports()
se puede conocer el listado de importaciones activas.