Cuando se desea realizar análisis de clúster uno de los algoritmos más utilizados es k-means. Lo que se explica por los buenos resultados que suele ofrecer con la mayoría de los conjuntos de datos y su simplicidad. Pero tiene un problema, es necesario conocer el número de clústeres en los que se debe dividir el […]
Revista Informática
Identificar el número de clústeres con Calinski-Harabasz en k-means e implementación en Python
Publicado el 16 junio 2023 por Daniel Rodríguez @analyticslane
Cuando se desea realizar análisis de clúster uno de los algoritmos más utilizados es k-means. Lo que se explica por los buenos resultados que suele ofrecer con la mayoría de los conjuntos de datos y su simplicidad. Pero tiene un problema, es necesario conocer el número de clústeres en los que se debe dividir el […]
Sus últimos artículos
-
Probabilidades y tests: por qué un resultado positivo no significa lo que crees
-
Faker en Python: qué es, para qué sirve y cómo generar datos sintéticos realistas
-
Qué es la variabilidad estadística y cómo evitar errores al analizar datos
-
Probabilidad y decisiones: cómo evitar caer en trampas estadísticas del día a día
