Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Residuos

Propósito

Los residuos son útiles para detectar valores atípicos y comprobar los supuestos de regresión lineal con respecto al término de error en el modelo de regresión.y Las observaciones de alto apalancamiento tienen residuales más pequeños porque a menudo desplazan la línea de regresión o la superficie más cerca de ellas. También puede utilizar residuos para detectar algunas formas de heteroscedasticidad y autocorrelación.

Definición

La matriz es una tabla de-por-4 que contiene cuatro tipos de residuos, con una fila para cada observación.Residuosn

Residuos brutos

Observado menos ajustados valores, es decir,

ri=yiy^.i

Los residuos de Pearson

Los residuos brutos divididos por el error medio cuadrado de la raíz, es decir,

pri=riMSE,

Dónderi es el residuo crudo y es el error cuadrado medio.MSE

Los residuos estandarizados

Los residuos estandarizados son residuos brutos divididos por su desviación estándar estimada. El residuo estandarizado para la observación esi

sti=riMSE(1hii),

¿Dónde está el error cuadrado medio yMSEhii es el valor de apalancamiento para la observación.i

Residuos studentized

Los residuos con studentized son los residuales brutos divididos por una estimación independiente de la desviación estándar residual. El residuo para la observación se divide por una estimación de la desviación estándar de error basada en todas las observaciones excepto en la observación.ii

sri=riMSE(i)(1hii),

DóndeMSE(i) es el error cuadrado medio del ajuste de regresión calculado eliminando la observación, yihii es el valor de apalancamiento para la observación.i El residuo estudentizadosri tiene una distribución con – – 1 grados de libertad.tnp

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Busque la tabla debajo del objeto.Residuosmdl

  • Obtenga cualquiera de estas columnas como vector indexando la propiedad utilizando la notación de puntos, por ejemplo,

    mdl.Residuals.Raw

  • Trace cualquiera de los residuales para los valores ajustados por el modelo utilizando for details, vea el método de la clase.

    plotResiduals(mdl)
    plotResidualsLinearModel

Evaluar supuestos de modelo utilizando residuos

En este ejemplo se muestra cómo evaluar los supuestos del modelo examinando los residuos de un modelo de regresión lineal ajustada.

Cargue los datos de ejemplo y almacene las variables independientes y de respuesta en una tabla.

 load imports-85  tbl = table(X(:,7),X(:,8),X(:,9),X(:,15),'VariableNames',... {'curb_weight','engine_size','bore','price'});

Ajuste un modelo de regresión lineal.

mdl = fitlm(tbl)
mdl =  Linear regression model:     price ~ 1 + curb_weight + engine_size + bore  Estimated Coefficients:                     Estimate        SE         tStat       pValue                      __________    _________    _______    __________      (Intercept)        64.095        3.703     17.309    2.0481e-41     curb_weight    -0.0086681    0.0011025    -7.8623      2.42e-13     engine_size     -0.015806     0.013255    -1.1925       0.23452     bore              -2.6998       1.3489    -2.0015      0.046711   Number of observations: 201, Error degrees of freedom: 197 Root Mean Squared Error: 3.95 R-squared: 0.674,  Adjusted R-Squared: 0.669 F-statistic vs. constant model: 136, p-value = 1.14e-47 

Trace el histograma de los residuos brutos.

plotResiduals(mdl)

El histograma muestra que los residuos son levemente sesgados.

Trace el diagrama de caja de los cuatro tipos de residuos.

 Res = table2array(mdl.Residuals);  boxplot(Res)

También puede ver la estructura sesgada a la derecha de los residuos en el diagrama de caja.

Trace la gráfica de probabilidad normal de los residuos sin procesar.

plotResiduals(mdl,'probability')

Esta gráfica de probabilidad normal también muestra la desviación de la normalidad y la asimetría en la cola derecha de la distribución de los residuos.

Trace los residuos en comparación con los residuales retrasados.

plotResiduals(mdl,'lagged')

Este gráfico muestra una tendencia, que indica una posible correlación entre los residuos. Puede comprobar esto utilizando.dwtest(mdl) La correlación serial entre los residuos generalmente significa que el modelo puede mejorarse.

Trace la gráfica de simetría de los residuos.

plotResiduals(mdl,'symmetry')

Esta gráfica también sugiere que los residuos no se distribuyen por igual alrededor de su mediana, como se espera para la distribución normal.

Trace los residuos frente a los valores ajustados.

plotResiduals(mdl,'fitted')

El aumento de la varianza como el aumento de los valores ajustados sugiere una posible heteroscedasticidad.

Referencias

[1] Atkinson, A. T. Plots, Transformations, and Regression. An Introduction to Graphical Methods of Diagnostic Regression Analysis. New York: Oxford Statistical Science Series, Oxford University Press, 1987.

[2] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models. IRWIN, The McGraw-Hill Companies, Inc., 1996.

[3] Belsley, D. A., E. Kuh, and R. E. Welsch. Regression Diagnostics, Identifying Influential Data and Sources of Collinearity. Wiley Series in Probability and Mathematical Statistics, John Wiley and Sons, Inc., 1980.

Consulte también

| | | | |

Temas relacionados