El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Revista Informática
Optimizar el número de clústeres con gap statistics
Publicado el 02 junio 2023 por Daniel Rodríguez @analyticslane
El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Sus últimos artículos
-
El Binning en Credit Scoring: El Arte de Discretizar Variables
-
Calibración vs Discriminación en Credit Scoring: diferencias clave y cómo evaluarlas
-
Ley de Benford: cómo detectar datos manipulados con ejemplos reales
-
Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
