Visualización y evaluación de clusters
El análisis de clusters organiza los datos en grupos en función de las similitudes entre los puntos de datos. En ocasiones, los datos contienen divisiones naturales que indican el número adecuado de clusters. En otras, los datos no contienen divisiones naturales o se desconocen. En tal caso, usted determina el número óptimo de clusters para agrupar los datos.
Para determinar en qué medida se ajustan los datos a un número concreto de clusters, calcule los valores de índice mediante diferentes criterios de evaluación, como la brecha o la silueta. Visualice los clusters creando un dendrograma para mostrar un árbol de clusters binario y jerárquico. Optimice el orden de las hojas para maximizar la suma de las similitudes entre hojas adyacentes. Para los datos agrupados con varias medidas en cada grupo, cree un dendrograma basado en las medias grupales calculadas mediante un análisis multivariante de la varianza (MANOVA).
Tareas de Live Editor
Agrupar datos | Cluster data using k-means or hierarchical clustering in the Live Editor (desde R2021b) |
Funciones
Objetos
CalinskiHarabaszEvaluation | Calinski-Harabasz criterion clustering evaluation object |
DaviesBouldinEvaluation | Davies-Bouldin criterion clustering evaluation object |
GapEvaluation | Gap criterion clustering evaluation object |
SilhouetteEvaluation | Silhouette criterion clustering evaluation object |
Temas
- Evaluación de clusters
En este ejemplo se muestra cómo identificar clusters utilizando
evalclusters
.