Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mahal

Distancia Mahalanobis

Descripción

ejemplo

d2 = mahal(Y,X) devuelve el cuadrado de cada observación en las muestras de referencia en .Distancia MahalanobisYX

Ejemplos

contraer todo

Genere un conjunto de datos de muestra bivariante correlacionado.

rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);

Especifique cuatro observaciones que sean equidistantes de la media de en distancia euclidiana.X

Y = [1 1;1 -1;-1 1;-1 -1];

Calcular la distancia Mahalanobis de cada observación en las muestras de referencia en .YX

d2_mahal = mahal(Y,X)
d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Calcular la distancia euclidiana cuadrada de cada observación en la media de .YX

d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

Trazar y mediante el uso y uso de color de marcador para visualizar la distancia Mahalanobis de a las muestras de referencia en .XYscatterYX

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')

Todas las observaciones en ( , , , y ) son equidistantes de la media de en la distancia euclidiana.Y[1,1][-1,-1,][1,-1][-1,1]X Sin embargo, y están mucho más cerca de X que y en la distancia Mahalanobis.[1,1][-1,-1][1,-1][-1,1] Dado que la distancia Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.

Argumentos de entrada

contraer todo

Datos, especificados como una matriz numérica, donde está el número de observaciones y es el número de variables en cada observación.nmnm

y debe tener el mismo número de columnas, pero puede tener diferentes números de filas.XY

Tipos de datos: single | double

Muestras de referencia, especificadas como una matriz numérica - por, donde está el número de muestras y es el número de variables en cada muestra.pmpm

y debe tener el mismo número de columnas, pero puede tener diferentes números de filas. debe tener más filas que columnas.XYX

Tipos de datos: single | double

Argumentos de salida

contraer todo

Al cuadrado de cada observación en las muestras de referencia en , devuelto como un vector numérico -by-1, donde está el número de observaciones en .Distancia MahalanobisYXnnX

Más acerca de

contraer todo

Distancia Mahalanobis

La distancia Mahalanobis es una medida entre un punto de muestra y una distribución.

La distancia Mahalanobis de un vector a una distribución con media y covarianza esyμΣ

d=(yμ)1(yμ)'.

Esta distancia representa la distancia a la media en número de desviaciones estándar.y

mahal devuelve la distancia cuadrada Mahalanobis d2 desde una observación en las muestras de referencia en .YX En mahal y son la media de la muestra y la covarianza de las muestras de referencia, respectivamente.μΣ

Consulte también

|

Introducido antes de R2006a