El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Revista Informática
Optimizar el número de clústeres con gap statistics
Publicado el 02 junio 2023 por Daniel Rodríguez @analyticslane
El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Sus últimos artículos
-
De la Regresión Logística al Scorecard: La Transformación Matemática
-
Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)
-
Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales
-
Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar
