Uno de los mayores problemas a la hora de trabajar con el algoritmo de k-means es la necesidad de conocer el número de clústeres en los que se debe dividir el conjunto de datos. Para lo que existen diferentes métodos como el del codo, la Silhouette, Gap Statistics o Calinski-Harabasz. En esta ocasión se va […]
Revista Informática
El índice de Davies-Bouldinen para estimar los clústeres en k-means e implementación en Python
Publicado el 30 junio 2023 por Daniel Rodríguez @analyticslane
Uno de los mayores problemas a la hora de trabajar con el algoritmo de k-means es la necesidad de conocer el número de clústeres en los que se debe dividir el conjunto de datos. Para lo que existen diferentes métodos como el del codo, la Silhouette, Gap Statistics o Calinski-Harabasz. En esta ocasión se va […]
Sus últimos artículos
-
Roles en ciencia de datos: Guía completa de perfiles técnicos
-
JSON en bases de datos: cuándo es buena idea y cuándo no
-
Probabilidades y tests: por qué un resultado positivo no significa lo que crees
-
Faker en Python: qué es, para qué sirve y cómo generar datos sintéticos realistas
