La Silhouette es una métrica que permite evaluar la calidad de los clústeres generados mediante algoritmos de clustering basados en la distancia euclídea. Como es el caso de k-means. Cuantificando la relación que existe entre la separación de los diferentes clústeres y la similitud entre los puntos de un mismo clúster en un valor que […]
Revista Informática
Número óptimo de clústeres con Silhouette e implementación en Python
Publicado el 23 junio 2023 por Daniel Rodríguez @analyticslane
La Silhouette es una métrica que permite evaluar la calidad de los clústeres generados mediante algoritmos de clustering basados en la distancia euclídea. Como es el caso de k-means. Cuantificando la relación que existe entre la separación de los diferentes clústeres y la similitud entre los puntos de un mismo clúster en un valor que […]
Sus últimos artículos
-
Roles en ciencia de datos: Guía completa de perfiles técnicos
-
JSON en bases de datos: cuándo es buena idea y cuándo no
-
Probabilidades y tests: por qué un resultado positivo no significa lo que crees
-
Faker en Python: qué es, para qué sirve y cómo generar datos sintéticos realistas
