Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Visualización y evaluación de clústeres

Trazar clústeres de datos y evaluar el número óptimo de clústeres

El análisis de clústeres organiza los datos en grupos basándose en similitudes entre los puntos de datos. A veces los datos contienen divisiones naturales que indican el número apropiado de racimos. Otras veces, los datos no contienen divisiones naturales, o las divisiones naturales son desconocidas. En tal caso, puede determinar el número óptimo de clústeres para agrupar sus datos.

Para determinar qué tan bien los datos se ajustan a un determinado número de clústeres, calcule los valores del índice utilizando diferentes criterios de evaluación, como Gap o Silhouette. Visualice los clústeres creando una gráfica dendrograma para mostrar un árbol de clúster binario jerárquico. Optimizar el orden de las hojas para maximizar la suma de las similitudes entre las hojas adyacentes. Para los datos agrupados con múltiples mediciones para cada grupo, se crea una gráfica dendrograma basada en el grupo de medios calculados mediante un análisis de varianza multivariante (MANOVA).

Funciones

expandir todo

dendrogramDendrogram plot
optimalleaforderOptimal leaf ordering for hierarchical clustering
manovaclusterDendrogram of group mean clusters following MANOVA
silhouetteSilhouette plot
evalclustersEvaluate clustering solutions
addKEvaluate additional numbers of clusters
compactCompact clustering evaluation object
increaseBIncrease reference data sets
plot Plot clustering evaluation object criterion values

Clases

CalinskiHarabaszEvaluationCalinski-Harabasz criterion clustering evaluation object
DaviesBouldinEvaluationDavies-Bouldin criterion clustering evaluation object
GapEvaluationGap criterion clustering evaluation object
SilhouetteEvaluationSilhouette criterion clustering evaluation object