Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

optimalleaforder

Ordenación de hojas óptima para clustering jerárquico

Descripción

ejemplo

leafOrder = optimalleaforder(tree,D) Devuelve un orden de hoja óptimo para el árbol de clústeres binarios jerárquicos, utilizando las distancias.treeD Un orden de hoja óptimo de un árbol binario maximiza la suma de las similitudes entre las hojas adyacentes al voltear las ramas de los árboles sin dividir los clústeres.

leafOrder = optimalleaforder(tree,D,Name,Value) Devuelve el orden de hoja óptimo mediante uno o varios argumentos de par nombre-valor.

Ejemplos

contraer todo

Cree un árbol de clústeres binarios jerárquicos utilizando.linkage A continuación, compare el diagrama de dendrograma con el orden predeterminado de un dendrograma con un orden de hoja óptimo.

Genere datos de ejemplo.

rng('default') % For reproducibility X = rand(10,2);

Cree un vector de distancia y un árbol de clustering binario jerárquico. Utilice las distancias y el árbol de clustering para determinar un orden de hoja óptimo.

D = pdist(X); tree = linkage(D,'average'); leafOrder = optimalleaforder(tree,D);

Trace el dendrograma con el orden predeterminado y el dendrograma con el orden óptimo de las hojas.

figure() subplot(2,1,1) dendrogram(tree) title('Default Leaf Order')  subplot(2,1,2) dendrogram(tree,'reorder',leafOrder) title('Optimal Leaf Order')

El orden de las hojas en la figura inferior corresponde a los elementos en.leafOrder

leafOrder
leafOrder = 1×10

     1     4     9    10     2     5     8     3     7     6

Genere datos de ejemplo.

rng('default') % For reproducibility X = rand(10,2);

Cree un vector de distancia y un árbol de clustering binario jerárquico.

D = pdist(X); tree = linkage(D,'average');

Utilice la transformación de similitud de distancia inversa para determinar un orden de hoja óptimo.

leafOrder = optimalleaforder(tree,D,'Transformation','inverse')
leafOrder = 1×10

     1     4     9    10     2     5     8     3     7     6

Argumentos de entrada

contraer todo

Árbol de clúster binario jerárquico, especificado como una (– 1)-por-3 matriz que se genera mediante, donde es el número de hojas.MlinkageM

Distancias para determinar similitudes entre las hojas, especificadas como una matriz o vector de distancias. Por ejemplo, puede generar distancias utilizando.pdist

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: Especifica que la suma de las similitudes se maximiza entre cada hoja y todas las demás hojas de los clústeres adyacentes, utilizando una transformación de similitud inversa.'Criteria','group','Transformation','inverse'

Criterio de optimización para determinar un orden de hoja óptimo, especificado como el par separado por comas consistente en uno de estos valores:'criteria'

'adjacent'Maximice la suma de similitudes entre las hojas adyacentes.
'group'Maximice la suma de similitudes entre cada hoja y todas las demás hojas en los racimos adyacentes en el mismo nivel del dendrograma.

Ejemplo: 'Criteria','group'

Método para transformar distancias a similitudes, especificado como el par separado por comas que consta de uno de, o un identificador de función.'Transformation''linear''inverse'

Dejar Di,j Y Simi,j denotan la distancia y la similitud entre las hojas y, respectivamente.ij Las transformaciones de similitud incluidas son:

'linear'Simi,j = maxi,j (di,j ) – di,j
'inverse'Simi,j = 1/di,j

Para utilizar una función de transformación personalizada, especifique un identificador para una función que acepte una matriz de distancias y devuelva una matriz de similitudes.DS La función debe ser monótona disminuyendo en el rango de valores de distancia. deben tener el mismo tamaño que, con la similitud calculada en función de.SDS(i,j)D(i,j)

Ejemplo: 'Transformation',@myTransform

Argumentos de salida

contraer todo

Orden de hoja óptima, devuelta como un vector de longitud, donde es el número de hojas. es una permutación del vector, dando un orden óptimo de la hoja basado en las distancias especificadas y la transformación de similitud.MMleafOrder1:M

Referencias

[1] Bar-Joseph, Z., Gifford, D.K., and Jaakkola, T.S. (2001). Fast optimal leaf ordering for hierarchical clustering. Bioinformatics 17, Suppl 1:S22–9. PMID: 11472989.

Consulte también

| |

Introducido en R2012b