Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

dendrogram

Parcela dedenramada

Descripción

ejemplo

dendrogram(tree) genera una gráfica dendrorama del árbol de clúster binario jerárquico. Un dendrograma consta de muchas líneas con forma de que conectan puntos de datos en un árbol jerárquico.U La altura de cada uno representa la distancia entre los dos puntos de datos que se están conectando.U

  • Si hay 30 o menos puntos de datos en el conjunto de datos original, cada hoja del dendrograma corresponde a un punto de datos.

  • Si hay más de 30 puntos de datos, las ramas inferiores contrae para que haya 30 nodos hoja.Dendrograma Como resultado, algunas hojas de la gráfica corresponden a más de un punto de datos.

ejemplo

dendrogram(tree,Name,Value) utiliza opciones adicionales especificadas por uno o más argumentos de par nombre-valor.

ejemplo

dendrogram(tree,P) genera una gráfica de dendrorama con no más que nodos hoja.P Si hay más de puntos de datos en el conjunto de datos original, a continuación, contrae las ramas inferiores del árbol.PDendrograma Como resultado, algunas hojas de la gráfica corresponden a más de un punto de datos.

dendrogram(tree,P,Name,Value) utiliza opciones adicionales especificadas por uno o más argumentos de par nombre-valor.

ejemplo

H = dendrogram(___) genera un trazado de dendrograma y devuelve un vector de identificadores de línea. Puede utilizar cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[H,T,outperm] = dendrogram(___) también devuelve un vector que contiene el número de nodo hoja para cada objeto en el conjunto de datos original, , y un vector que da el orden de las etiquetas de nodo de las hojas como se muestra en el dendrograma, .Toutperm

  • Es útil devolver cuando el número de nodos hoja, , es menor que el número total de puntos de datos, por lo que algunos nodos hoja en la pantalla corresponden a varios puntos de datos.TP

  • El orden de las etiquetas de nodo dadas es de izquierda a derecha para un dendrograma horizontal, y de abajo a arriba para un dendrograma vertical.outperm

Ejemplos

contraer todo

Generar datos de ejemplo.

rng('default') % For reproducibility X = rand(10,3);

Cree un árbol de clúster binario jerárquico mediante .linkage A continuación, trace el dendrograma utilizando las opciones predeterminadas.

tree = linkage(X,'average');  figure() dendrogram(tree)

Generar datos de ejemplo.

rng('default') % For reproducibility X = rand(10,3);

Cree un árbol de clúster binario jerárquico mediante .linkage

tree = linkage(X,'average');  D = pdist(X); leafOrder = optimalleaforder(tree,D)
leafOrder = 1×10

     3     7     6     1     4     9     5     8    10     2

Trazar el dendrograma utilizando un orden óptimo de las hojas.

figure() dendrogram(tree,'Reorder',leafOrder)

El orden de los nodos hoja en la gráfica de dendrograma corresponde - de izquierda a derecha - a la permutación en .leafOrder

Generar datos de ejemplo.

rng('default') % For reproducibility X = rand(100,2);

Hay 100 puntos de datos en el conjunto de datos original, .X

Cree un árbol de clúster binario jerárquico mediante .linkage A continuación, trace el dendrograma para el árbol completo (100 nodos hoja) estableciendo el argumento de entrada igual a .P0

tree = linkage(X,'average'); dendrogram(tree,0)

Ahora, traza el dendrograma con solo 25 nodos hoja. Devuelve la asignación de los puntos de datos originales a los nodos hoja que se muestran en el trazado.

figure [~,T] = dendrogram(tree,25);

Enumere los puntos de datos originales que se encuentran en el nodo hoja 7 de la gráfica de dendrograma.

find(T==7)
ans = 7×1

     7
    33
    60
    70
    74
    76
    86

Generar datos de ejemplo.

rng('default') % For reproducibility X = rand(10,3);

Cree un árbol de clúster binario jerárquico mediante .linkage A continuación, trazar el dendrograma con una orientación vertical, utilizando el umbral de color predeterminado. Devolver identificadores a las líneas para que pueda cambiar los anchos de línea de dendrograma.

tree = linkage(X,'average'); H = dendrogram(tree,'Orientation','left','ColorThreshold','default'); set(H,'LineWidth',2)

Argumentos de entrada

contraer todo

El árbol de clúster binario jerárquico, especificado como una matriz ( – 1) por 3 que se genera mediante , donde está el número de puntos de datos en el conjunto de datos original.MlinkageM

Número máximo de nodos hoja que se incluirán en el trazado de dendrograma, especificado como un valor entero positivo.

  • Si hay o menos puntos de datos en el conjunto de datos original, cada hoja del dendrograma corresponde a un punto de datos.P

  • Si hay más que puntos de datos, a continuación, contrae las ramas inferiores para que haya nodos hoja.PDendrogramaP Como resultado, algunas hojas de la gráfica corresponden a más de un punto de datos.

    Si no especifica , utilice 30 como número máximo de nodos hoja.PDendrograma Para mostrar el árbol completo, establezca igual a .P0

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: especifica un dendrograma vertical con hojas en el orden especificado por .'Orientation','left','Reorder',myOrdermyOrder

Orden de nodos hoja en la gráfica de dendrograma, especificado como el par separado por comas que consta de y un vector que da el orden de los nodos en el árbol completo.'Reorder' El vector de orden debe ser una permutación del vector, donde está el número de puntos de datos en el conjunto de datos original.1:MM Especifique el orden de izquierda a derecha para los dendrogramas horizontales y de abajo a arriba para los dendrogramas verticales.

Si es mayor que el número de nodos hoja en la gráfica de dendrograma ( de forma predeterminada, es 30), entonces sólo puede especificar un vector de permutación que no separe los grupos de hojas que corresponden a los nodos contraídos.MPP

Tipos de datos: single | double

Indicador de si se debe comprobar si hay que cruzar ramas en la gráfica de dendrograma, especificado como el par separado por comas que consta de y o .'CheckCrossing'truefalse Esta opción solo es útil cuando se especifica un valor para .Reorder

Cuando tiene el valor , emite una advertencia si el orden de los nodos hoja provoca el cruce de ramas en el trazado.CheckCrossingtrueDendrograma Si la gráfica de dendrograma no muestra un árbol completo (porque el número de puntos de datos en el conjunto de datos original es mayor que ), solo emite una advertencia cuando el orden de los nodos hoja hace que la rama se cruce en el dendrograma como se muestra en el trazado.PDendrograma Es decir, no hay ninguna advertencia si la orden provoca el cruce de ramas en el árbol completo, pero no en el dendrograma como se muestra en la gráfica.

Tipos de datos: logical

Umbral para colores únicos en el trazado de dendrograma, especificado como el par separado por comas que consta de y bien o un valor escalar en el rango .'ColorThreshold''default'(0,max(tree(:,3))) Si tiene el valor , a continuación, asigna un color único a cada grupo de nodos en el dendrograma cuyo vinculación es menor que .ColorThresholdTDendrogramaT

  • Si tiene el valor , a continuación, el umbral, , es el 70% de la vinculación máxima, .ColorThreshold'default'T0.7*max(tree(:,3))

  • Si no especifica un valor para , o si especifica un umbral fuera del intervalo , solo utilice un color para el trazado de dendrograma.ColorThreshold(0,max(tree(:,3)))Dendrograma

Orientación del dendrograma en la ventana de figura, especificada como el par separado por comas que consta de y uno de estos valores:'Orientation'

'top'De arriba a abajo
'bottom'De abajo a arriba
'left'De izquierda a derecha
'right'De derecha a izquierda

Etiqueta para cada punto de datos del conjunto de datos original, especificada como el par separado por comas que consta de y una matriz de caracteres, matriz de cadenas o matriz de celdas de vectores de caracteres. etiqueta cualquier hoja en la gráfica de dendrograma que contenga un único punto de datos con la etiqueta de ese punto de datos.'Labels'Dendrograma

Argumentos de salida

contraer todo

Maneja las líneas en el trazado de dendrograma, devuelto como vector.

Números de nodo hoja para cada punto de datos del conjunto de datos original, devueltos como un vector de columna de longitud, donde está el número de puntos de datos del conjunto de datos original.MM

Cuando hay menos de puntos de datos en los datos originales (es 30, de forma predeterminada), todos los puntos de datos se muestran en el dendrograma, con cada nodo que contiene un único punto de datos.PP En este caso, es el mapa de identidades, .TT = (1:M)'

es útil cuando es menor que el número total de puntos de datos.TP Es decir, cuando algunos nodos hoja en la pantalla de dendrograma corresponden a varios puntos de datos. Por ejemplo, para averiguar qué puntos de datos se encuentran en el nodo hoja de la gráfica de dendrograma, utilice .kfind(T==k)

Permutación de las etiquetas de nodo de las hojas del dendrograma como se muestra en el trazado, devuelto como vector de fila. da el orden de izquierda a derecha para un dendrograma horizontal, y de abajo a arriba para un dendrograma vertical.outperm Si hay hojas en la gráfica de dendrograma, es una permutación del vector.Poutperm1:P

Introducido antes de R2006a