Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

mahal

Distancia de Mahalanobis respecto a muestras de referencia

Descripción

d2 = mahal(Y,X) devuelve la distancia de Mahalanobis cuadrada de cada observación de Y respecto a las muestras de referencia de X.

ejemplo

Ejemplos

contraer todo

Genere un conjunto de datos de muestra bivariante correlacionada.

rng('default') % For reproducibility
X = mvnrnd([0;0],[1 .9;.9 1],1000);

Especifique cuatro observaciones que sean equidistantes de la media de X en distancia euclidiana.

Y = [1 1;1 -1;-1 1;-1 -1];

Calcule la distancia de Mahalanobis de cada observación de Y respecto a las muestras de referencia de X.

d2_mahal = mahal(Y,X)
d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Calcule la distancia euclidiana cuadrada de cada observación de Y de la media de X.

d2_Euclidean = sum((Y-mean(X)).^2,2)
d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

Represente X e Y utilizando scatter y emplee el color de los marcadores para visualizar la distancia de Mahalanobis de Y respecto a las muestras de referencia de X.

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled')
hb = colorbar;
ylabel(hb,'Mahalanobis Distance')
legend('X','Y','Location','best')

Todas las observaciones de Y ([1,1], [-1,-1,], [1,-1] y [-1,1]) son equidistantes de la media de X en distancia euclidiana. Sin embargo, [1,1] y [-1,-1] están mucho más cerca de [1,-1] y [-1,1] en la distancia de Mahalanobis. Dado que la distancia de Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.

Argumentos de entrada

contraer todo

Datos, especificados como una matriz numérica de n por m, donde n es el número de observaciones y m es el número de variables de cada observación.

X e Y deben tener el mismo número de columnas, pero pueden tener diferentes números de filas.

Tipos de datos: single | double

Muestras de referencia, especificadas como una matriz numérica de p por m, donde p es el número de muestras y m es el número de variables de cada muestra.

X e Y deben tener el mismo número de columnas, pero pueden tener diferentes números de filas. X debe tener más filas que columnas.

Tipos de datos: single | double

Argumentos de salida

contraer todo

Distancia de Mahalanobis cuadrada de cada observación de Y respecto a las muestras de referencia de X, devuelta como un vector numérico de n por 1, donde n corresponde al número de observaciones de X.

Más acerca de

contraer todo

Distancia de Mahalanobis

La distancia de Mahalanobis es una medida entre un punto de muestra y una distribución.

La distancia de Mahalanobis de un vector y respecto a una distribución con media μ y covarianza Σ es

d=(yμ)1(yμ)'.

Esta distancia representa lo lejos que y está de la media en número de desviaciones estándar.

mahal devuelve la distancia de Mahalanobis d2 cuadrada de una observación de Y respecto a las muestras de referencia de X. En la función mahal, μ y Σ son la media de la muestra y la covarianza de las muestras de referencia, respectivamente.

Historial de versiones

Introducido antes de R2006a