Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mahal

Mahalanobis distancia

Descripción

ejemplo

d2 = mahal(Y,X) Devuelve el cuadrado de cada observación en las muestras de referencia en.Mahalanobis distanciaYX

Ejemplos

contraer todo

Genere un conjunto de datos de ejemplo bivariado correlacionado.

rng('default') % For reproducibility X = mvnrnd([0;0],[1 .9;.9 1],1000);

Especifique cuatro observaciones que sean equidistantes de la media de la distancia euclidiana.X

Y = [1 1;1 -1;-1 1;-1 -1];

Calcule la distancia de Mahalanobis de cada observación en las muestras de referencia en.YX

d2_mahal = mahal(Y,X)
d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Computa la distancia euclidiana cuadrada de cada observación desde la media de.YX

d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

Trazar y utilizar y usar el color del marcador para visualizar la distancia de Mahalanobis de las muestras de referencia en.XYscatterYX

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10 hold on scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled') hb = colorbar; ylabel(hb,'Mahalanobis Distance') legend('X','Y','Location','best')

Todas las observaciones en (,,, y) son equidistantes de la media de la distancia euclidiana.Y[1,1][-1,-1,][1,-1][-1,1]X Sin embargo, y están mucho más cerca de X que y en Mahalanobis distancia.[1,1][-1,-1][1,-1][-1,1] Debido a que la distancia de Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.

Argumentos de entrada

contraer todo

Datos, especificados como una matriz-por-numérica, donde es el número de observaciones y es el número de variables en cada observación.nmnm

y debe tener el mismo número de columnas, pero puede tener diferentes números de filas.XY

Tipos de datos: single | double

Ejemplos de referencia, especificados como una matriz numérica, donde es el número de muestras y es el número de variables en cada muestra.pmpm

y debe tener el mismo número de columnas, pero puede tener diferentes números de filas. debe tener más filas que columnas.XYX

Tipos de datos: single | double

Argumentos de salida

contraer todo

Cuadrado de cada observación en las muestras de referencia en, devuelto como un vector numérico-por-1, donde es el número de observaciones en.Mahalanobis distanciaYXnnX

Más acerca de

contraer todo

Mahalanobis Distance

La distancia de Mahalanobis es una medida entre un punto de muestra y una distribución.

La distancia de Mahalanobis de un vector a una distribución con media y covarianza esyμΣ

d=(yμ)1(yμ)'.

Esta distancia representa lo lejos que está de la media en número de desviaciones estándar.y

mahal Devuelve la distancia de Mahalanobis cuadrada d2 de una observación en las muestras de referencia en.YX En mahal función, y son la media de la muestra y la covarianza de las muestras de referencia, respectivamente.μΣ

Consulte también

|

Introducido antes de R2006a