mahal

Distancia de Mahalanobis respecto a muestras de referencia

Sintaxis

d2 = mahal(Y,X)

Descripción

d2 = mahal(Y,X) devuelve la distancia de Mahalanobis cuadrada de cada observación de Y respecto a las muestras de referencia de X.

ejemplo

Ejemplos

contraer todo

Comparar distancias euclidianas cuadradas y de Mahalanobis

Abrir script en vivo

Genere un conjunto de datos de muestra bivariante correlacionada.

rng('default') % For reproducibility
X = mvnrnd([0;0],[1 .9;.9 1],1000);

Especifique cuatro observaciones que sean equidistantes de la media de X en distancia euclidiana.

Y = [1 1;1 -1;-1 1;-1 -1];

Calcule la distancia de Mahalanobis de cada observación de Y respecto a las muestras de referencia de X.

d2_mahal = mahal(Y,X)

d2_mahal = 4×1

    1.1095
   20.3632
   19.5939
    1.0137

Calcule la distancia euclidiana cuadrada de cada observación de Y de la media de X.

d2_Euclidean = sum((Y-mean(X)).^2,2)

d2_Euclidean = 4×1

    2.0931
    2.0399
    1.9625
    1.9094

Represente X e Y utilizando scatter y emplee el color de los marcadores para visualizar la distancia de Mahalanobis de Y respecto a las muestras de referencia de X.

scatter(X(:,1),X(:,2),10,'.') % Scatter plot with points of size 10
hold on
scatter(Y(:,1),Y(:,2),100,d2_mahal,'o','filled')
hb = colorbar;
ylabel(hb,'Mahalanobis Distance')
legend('X','Y','Location','best')

Figure contains an axes object. The axes object contains 2 objects of type scatter. These objects represent X, Y.

Todas las observaciones de Y ([1,1], [-1,-1,], [1,-1] y [-1,1]) son equidistantes de la media de X en distancia euclidiana. Sin embargo, [1,1] y [-1,-1] están mucho más cerca de [1,-1] y [-1,1] en la distancia de Mahalanobis. Dado que la distancia de Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.

Argumentos de entrada

contraer todo

`Y` — Datos
Matriz numérica de n por m

Datos, especificados como una matriz numérica de n por m, donde n es el número de observaciones y m es el número de variables de cada observación.

X e Y deben tener el mismo número de columnas, pero pueden tener diferentes números de filas.

Tipos de datos: single | double

`X` — Muestras de referencia
Matriz numérica de p por m

Muestras de referencia, especificadas como una matriz numérica de p por m, donde p es el número de muestras y m es el número de variables de cada muestra.

X e Y deben tener el mismo número de columnas, pero pueden tener diferentes números de filas. X debe tener más filas que columnas.

Tipos de datos: single | double

Argumentos de salida

contraer todo

`d2` — Distancia de Mahalanobis cuadrada
Vector numérico de n por 1

Distancia de Mahalanobis cuadrada de cada observación de Y respecto a las muestras de referencia de X, devuelta como un vector numérico de n por 1, donde n corresponde al número de observaciones de X.

Más acerca de

contraer todo

Distancia de Mahalanobis

La distancia de Mahalanobis es una medida entre un punto de muestra y una distribución.

La distancia de Mahalanobis de un vector y respecto a una distribución con media μ y covarianza C es

$d = \sqrt{(y - μ) C^{- 1} (y - μ)'} .$

Esta distancia representa lo lejos que y está de la media en número de desviaciones estándar.

mahal devuelve la distancia de Mahalanobis d² cuadrada de una observación de Y respecto a las muestras de referencia de X. En la función mahal, μ y C son la media de la muestra y la covarianza de las muestras de referencia, respectivamente.

Sugerencias

Cada vez que llame a la función mahal, calcula la matriz de covarianzas de las muestras de referencia. En los casos en los que desee calcular distancias de Mahalanobis entre varios conjuntos de datos y las mismas muestras de referencia de X, puede ahorrar tiempo de computación calculando la matriz de covarianzas de X solo una vez y proporcionándosela a la función pdist2. Para ver un ejemplo, consulte Calcular la distancia de Mahalanobis.

Historial de versiones

Introducido antes de R2006a

Consulte también

Temas

Unsupervised Anomaly Detection

mahal

Sintaxis

Descripción

Ejemplos

Comparar distancias euclidianas cuadradas y de Mahalanobis

Argumentos de entrada

Y — Datos Matriz numérica de n por m

X — Muestras de referencia Matriz numérica de p por m

Argumentos de salida

d2 — Distancia de Mahalanobis cuadrada Vector numérico de n por 1

Más acerca de

Distancia de Mahalanobis

Sugerencias

Historial de versiones

Consulte también

Temas

`Y` — Datos
Matriz numérica de n por m

`X` — Muestras de referencia
Matriz numérica de p por m

`d2` — Distancia de Mahalanobis cuadrada
Vector numérico de n por 1