Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Visualización y evaluación de clusters

Represente clusters de datos y evalúe el número óptimo de clusters

El análisis de clusters organiza los datos en grupos en función de las similitudes entre los puntos de datos. En ocasiones, los datos contienen divisiones naturales que indican el número adecuado de clusters. En otras, los datos no contienen divisiones naturales o se desconocen. En tal caso, usted determina el número óptimo de clusters para agrupar los datos.

Para determinar en qué medida se ajustan los datos a un número concreto de clusters, calcule los valores de índice mediante diferentes criterios de evaluación, como la brecha o la silueta. Visualice los clusters creando un dendrograma para mostrar un árbol de clusters binario y jerárquico. Optimice el orden de las hojas para maximizar la suma de las similitudes entre hojas adyacentes. Para los datos agrupados con varias medidas en cada grupo, cree un dendrograma basado en las medias grupales calculadas mediante un análisis multivariante de la varianza (MANOVA).

Tareas de Live Editor

Agrupar datosCluster data using k-means or hierarchical clustering in the Live Editor (desde R2021b)

Funciones

expandir todo

dendrogramDendrograma
optimalleaforderOptimal leaf ordering for hierarchical clustering
manovaclusterDendrogram of group mean clusters following MANOVA
silhouetteSilhouette plot
evalclustersEvaluate clustering solutions
addKEvaluate additional numbers of clusters
compactCompact clustering evaluation object
increaseBIncrease reference data sets
plot Plot clustering evaluation object criterion values

Objetos

CalinskiHarabaszEvaluationCalinski-Harabasz criterion clustering evaluation object
DaviesBouldinEvaluationDavies-Bouldin criterion clustering evaluation object
GapEvaluationGap criterion clustering evaluation object
SilhouetteEvaluationSilhouette criterion clustering evaluation object

Temas