Genere un conjunto de datos de muestra bivariante correlacionada.
Especifique cuatro observaciones que sean equidistantes de la media de X en distancia euclidiana.
Calcule la distancia de Mahalanobis de cada observación de Y respecto a las muestras de referencia de X.
d2_mahal = 4×1
1.1095
20.3632
19.5939
1.0137
Calcule la distancia euclidiana cuadrada de cada observación de Y de la media de X.
d2_Euclidean = 4×1
2.0931
2.0399
1.9625
1.9094
Represente X e Y utilizando scatter y emplee el color de los marcadores para visualizar la distancia de Mahalanobis de Y respecto a las muestras de referencia de X.
Todas las observaciones de Y ([1,1], [-1,-1,], [1,-1] y [-1,1]) son equidistantes de la media de X en distancia euclidiana. Sin embargo, [1,1] y [-1,-1] están mucho más cerca de [1,-1] y [-1,1] en la distancia de Mahalanobis. Dado que la distancia de Mahalanobis considera la covarianza de los datos y las escalas de las diferentes variables, es útil para detectar valores atípicos.