Contar con unos datos de calidad es clave para que los resultados de un análisis de datos sean válidos. Sin embargo, en la mayoría de las ocasiones, los conjuntos de datos suelen tener múltiples problemas de calidad. Por ejemplo, la presencia de valores nulos, nombres de columnas no estandarizados y datos mal formateados. En esta […]
Revista Informática
Limpieza de datos con Pyjanitor: Optimizando los flujos de trabajo
Publicado el 15 abril 2024 por Daniel Rodríguez @analyticslane
Contar con unos datos de calidad es clave para que los resultados de un análisis de datos sean válidos. Sin embargo, en la mayoría de las ocasiones, los conjuntos de datos suelen tener múltiples problemas de calidad. Por ejemplo, la presencia de valores nulos, nombres de columnas no estandarizados y datos mal formateados. En esta […]
Sus últimos artículos
-
Ley de Benford: cómo detectar datos manipulados con ejemplos reales
-
Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
-
De la Regresión Logística al Scorecard: La Transformación Matemática
-
Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)
