Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Visualización y evaluación de clústeres

Trazar clústeres de datos y evaluar el número óptimo de clústeres

El análisis de clústerorganiza los datos en grupos en función de las similitudes entre los puntos de datos. A veces, los datos contienen divisiones naturales que indican el número adecuado de clústeres. Otras veces, los datos no contienen divisiones naturales, o las divisiones naturales son desconocidas. En tal caso, se determina el número óptimo de clústeres para agrupar los datos.

Para determinar qué tan bien encajan los datos en un número determinado de clústeres, calcule los valores de índice utilizando diferentes criterios de evaluación, como separación o silueta. Visualice clústeres mediante la creación de un trazado de dendrograma para mostrar un árbol de clúster binario jerárquico. Optimice el orden de las hojas para maximizar la suma de las similitudes entre las hojas adyacentes. Para los datos agrupados con múltiples mediciones para cada grupo, cree una gráfica de dendrorama basada en los medios de grupo calculados mediante un análisis multivariado de varianza (MANOVA).

Funciones

expandir todo

dendrogramParcela dedenramada
optimalleaforderOptimal leaf ordering for hierarchical clustering
manovaclusterDendrogram of group mean clusters following MANOVA
silhouetteSilhouette plot
evalclustersEvaluate clustering solutions
addKEvaluate additional numbers of clusters
compactCompact clustering evaluation object
increaseBIncrease reference data sets
plot Plot clustering evaluation object criterion values

Clases

CalinskiHarabaszEvaluationCalinski-Harabasz criterion clustering evaluation object
DaviesBouldinEvaluationDavies-Bouldin criterion clustering evaluation object
GapEvaluationGap criterion clustering evaluation object
SilhouetteEvaluationSilhouette criterion clustering evaluation object

Temas

Cluster Evaluation

This example shows how to identify clusters by using evalclusters.