Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Hat Matrix y leverage

Hat Matrix

Propósito

La matriz de sombreros proporciona una medida de apalancamiento. Es útil para investigar si una o más observaciones son periféricas con respecto a sus valores, y por lo tanto pueden influir excesivamente en los resultados de la regresión.X

Definición

La matriz de sombreros también se conoce como el porque proyecta el vector de observaciones, y, en el vector de predicciones,projection matrix y^, poniendo así el "sombrero" en y. La matriz de sombreros se define en términos de la matriz de datos:HX

= (HXXTX)–1XT

y determina los valores ajustados o previstos desde

y^=Hy=Xb.

Los elementos diagonales de,Hhii, se denominan apalancamientos y satisfacen

0hii1i=1nhii=p,

donde está el número de coeficientes, y es el número de observaciones (filas de) en el modelo de regresión. es una-por-matriz en la tabla.pnXHatMatrixnnDiagnostics

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Mostrar el indexado en la propiedad mediante la notación de puntos cuando es grande, puede ser costoso computacionalmente.HatMatrix

    mdl.Diagnostics.HatMatrix
    nHatMatrix En esos casos, puede obtener los valores diagonales directamente, utilizando

    mdl.Diagnostics.Leverage

apalancamiento

Propósito

El apalancamiento es una medida del efecto de una observación particular sobre las predicciones de regresión debido a la posición de esa observación en el espacio de las entradas. En general, cuanto más lejos esté un punto del centro del espacio de entrada, más apalancamiento tiene. Dado que la suma de los valores de apalancamiento es, una observación se puede considerar como un valor atípico si su apalancamiento excede sustancialmente el valor medio de apalancamiento,/, por ejemplo, un precio mayor que 2 */.pipnpn

Definición

El apalancamiento de la observación es el valor del término diagonal,iihii, de la matriz de sombreros, dondeH

= (HXXT)X–1XT.

Los términos diagonales satisfacen

0hii1i=1nhii=p,

donde está el número de coeficientes en el modelo de regresión, y es el número de observaciones.pn El valor mínimo dehii es 1/para un modelo con un término constante.n Si el modelo ajustado pasa por el origen, el valor de apalancamiento mínimo es 0 para una observación en = 0.x

Es posible expresar los valores ajustados, y^, por los valores observados, ya quey

y^=Hy=Xb.

por lo tantohii expresa cuánto la observación yi tiene impacto en y^i. Un gran valor dehii indica que el caso TH está distante del centro de todos los valores X para todos los casos y tiene más apalancamiento. es un vector de columna de-por-1 en la tabla.inapalancamientonDiagnostics

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Visualice el vector indexando la propiedad utilizando la notación de puntosapalancamiento

    mdl.Diagnostics.Leverage

  • Trace el apalancamiento para los valores ajustados por el modelo utilizando ver el método de la clase para obtener más información.

    plotDiagnostics(mdl)
    plotDiagnosticsLinearModel

Determine las observaciones de alto apalancamiento

Este ejemplo muestra cómo calcular valores y evaluar observaciones de apalancamiento alto.apalancamiento Cargue los datos de ejemplo y defina la respuesta y las variables independientes.

load hospital y = hospital.BloodPressure(:,1); X = double(hospital(:,2:5));

Ajuste un modelo de regresión lineal.

mdl = fitlm(X,y);

Trace los valores de apalancamiento.

plotDiagnostics(mdl)

Para este ejemplo, el valor de umbral recomendado es 2 * 5/100 = 0,1. No hay indicios de observaciones de alto apalancamiento.

Consulte también

| | |

Temas relacionados