Genere un conjunto de datos de muestra bivariante correlacionada.
Especifique cuatro observaciones que sean equidistantes de la media de X
en distancia euclidiana.
Calcule la distancia de Mahalanobis de cada observación de Y
respecto a las muestras de referencia de X
.
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Calcule la distancia euclidiana cuadrada de cada observación de Y
de la media de X
.
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
Represente X
e Y
utilizando scatter
y emplee el color de los marcadores para visualizar la distancia de Mahalanobis de Y
respecto a las muestras de referencia de X
.
Todas las observaciones de Y
([1,1]
, [-1,-1,]
, [1,-1]
y [-1,1]
) son equidistantes de la media de X
en distancia euclidiana. Sin embargo, [1,1]
y [-1,-1]
están mucho más cerca de [1,-1]
y [-1,1]
en la distancia de Mahalanobis. Dado que la distancia de Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.