Optimizar el número de clústeres con gap statistics

Publicado el 02 junio 2023 por Daniel Rodríguez @analyticslane
El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]