Contar con unos datos de calidad es clave para que los resultados de un análisis de datos sean válidos. Sin embargo, en la mayoría de las ocasiones, los conjuntos de datos suelen tener múltiples problemas de calidad. Por ejemplo, la presencia de valores nulos, nombres de columnas no estandarizados y datos mal formateados. En esta […]
Revista Informática
Limpieza de datos con Pyjanitor: Optimizando los flujos de trabajo
Publicado el 15 abril 2024 por Daniel Rodríguez @analyticslane
Contar con unos datos de calidad es clave para que los resultados de un análisis de datos sean válidos. Sin embargo, en la mayoría de las ocasiones, los conjuntos de datos suelen tener múltiples problemas de calidad. Por ejemplo, la presencia de valores nulos, nombres de columnas no estandarizados y datos mal formateados. En esta […]
Sus últimos artículos
-
Exactitud, precisión, recall… qué mide realmente cada métrica (y qué no)
-
Roles en ciencia de datos: Guía completa de perfiles técnicos
-
JSON en bases de datos: cuándo es buena idea y cuándo no
-
Probabilidades y tests: por qué un resultado positivo no significa lo que crees
