La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Visualización y evaluación de clusters

Represente clusters de datos y evalúe el número óptimo de clusters

El análisis de clusters organiza los datos en grupos en función de las similitudes entre los puntos de datos. En ocasiones, los datos contienen divisiones naturales que indican el número adecuado de clusters. En otras, los datos no contienen divisiones naturales o se desconocen. En tal caso, usted determina el número óptimo de clusters para agrupar los datos.

Para determinar en qué medida se ajustan los datos a un número concreto de clusters, calcule los valores de índice mediante diferentes criterios de evaluación, como la brecha o la silueta. Visualice los clusters creando un dendrograma para mostrar un árbol de clusters binario y jerárquico. Optimice el orden de las hojas para maximizar la suma de las similitudes entre hojas adyacentes. Para los datos agrupados con varias medidas en cada grupo, cree un dendrograma basado en las medias grupales calculadas mediante un análisis multivariante de la varianza (MANOVA).

Tareas de Live Editor

Agrupar datos

Cluster data using k-means or hierarchical clustering in the Live Editor (Desde R2021b)

Funciones

expandir todo

Visualización de clusters

`dendrogram`	Dendrograma
`optimalleaforder`	Optimal leaf ordering for hierarchical clustering
`manovacluster`	Dendrogram of group mean clusters following MANOVA
`silhouette`	Silhouette plot

Evaluación de clusters

`evalclusters`	Evaluate clustering solutions
`addK`	Evaluate additional numbers of clusters
`compact`	Compact clustering evaluation object
`increaseB`	Increase reference data sets
`plot`	Plot clustering evaluation object criterion values

Objetos

`CalinskiHarabaszEvaluation`	Calinski-Harabasz criterion clustering evaluation object
`DaviesBouldinEvaluation`	Davies-Bouldin criterion clustering evaluation object
`GapEvaluation`	Gap criterion clustering evaluation object
`SilhouetteEvaluation`	Silhouette criterion clustering evaluation object

Temas

Evaluar el número óptimo de clusters
Identifique el número óptimo de clusters en un conjunto de datos utilizando la función evalclusters.