El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Revista Informática
Optimizar el número de clústeres con gap statistics
Publicado el 02 junio 2023 por Daniel Rodríguez @analyticslane
El mayor problema con el que nos podemos encontrar a la hora de usar el algoritmo de k-means es conocer el número de clústeres en los que se divide el conjunto de datos. Un hiperparámetro que en Scikit-learn debe ser indicado al construir el objeto. Por eso existen múltiples métodos para seleccionar este valor como […]
Sus últimos artículos
-
Faker en Python: qué es, para qué sirve y cómo generar datos sintéticos realistas
-
Qué es la variabilidad estadística y cómo evitar errores al analizar datos
-
Probabilidad y decisiones: cómo evitar caer en trampas estadísticas del día a día
-
El valor esperado: la mejor herramienta que casi nadie usa
