Visualización y evaluación de clusters
El análisis de clusters organiza los datos en grupos en función de las similitudes entre los puntos de datos. En ocasiones, los datos contienen divisiones naturales que indican el número adecuado de clusters. En otras, los datos no contienen divisiones naturales o se desconocen. En tal caso, usted determina el número óptimo de clusters para agrupar los datos.
Para determinar en qué medida se ajustan los datos a un número concreto de clusters, calcule los valores de índice mediante diferentes criterios de evaluación, como la brecha o la silueta. Visualice los clusters creando un dendrograma para mostrar un árbol de clusters binario y jerárquico. Optimice el orden de las hojas para maximizar la suma de las similitudes entre hojas adyacentes. Para los datos agrupados con varias medidas en cada grupo, cree un dendrograma basado en las medias grupales calculadas mediante un análisis multivariante de la varianza (MANOVA).
Funciones
Objetos
CalinskiHarabaszEvaluation | Calinski-Harabasz criterion clustering evaluation object |
DaviesBouldinEvaluation | Davies-Bouldin criterion clustering evaluation object |
GapEvaluation | Gap criterion clustering evaluation object |
SilhouetteEvaluation | Silhouette criterion clustering evaluation object |
Temas
- Cluster Evaluation
This example shows how to identify clusters by using
evalclusters
.