El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Revista Informática
Optimizar el número de clústeres con gap statistics
Publicado el 02 junio 2023 por Daniel Rodríguez @analyticslane
El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Sus últimos artículos
-
Hardening avanzado de NGINX: CSP, OCSP Stapling y defensa en profundidad
-
Nuevo simulador FIRE en el laboratorio de aplicaciones de Analytics Lane
-
Hardening de NGINX en 2026: configuración segura básica paso a paso
-
Exactitud, precisión, recall… qué mide realmente cada métrica (y qué no)
