Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.
Los residuos son útiles para detectar valores atípicos y comprobar los supuestos de regresión lineal con respecto al término de error en el modelo de regresión.y Las observaciones de alto apalancamiento tienen residuales más pequeños porque a menudo desplazan la línea de regresión o la superficie más cerca de ellas. También puede utilizar residuos para detectar algunas formas de heteroscedasticidad y autocorrelación.
La matriz es una tabla de-por-4 que contiene cuatro tipos de residuos, con una fila para cada observación.Residuos
n
Observado menos ajustados valores, es decir,
Los residuos brutos divididos por el error medio cuadrado de la raíz, es decir,
Dónderi es el residuo crudo y es el error cuadrado medio.MSE
Los residuos estandarizados son residuos brutos divididos por su desviación estándar estimada. El residuo estandarizado para la observación esi
¿Dónde está el error cuadrado medio yMSEhii es el valor de apalancamiento para la observación.i
Los residuos con studentized son los residuales brutos divididos por una estimación independiente de la desviación estándar residual. El residuo para la observación se divide por una estimación de la desviación estándar de error basada en todas las observaciones excepto en la observación.ii
DóndeMSE(i) es el error cuadrado medio del ajuste de regresión calculado eliminando la observación, yihii es el valor de apalancamiento para la observación.i El residuo estudentizadosri tiene una distribución con – – 1 grados de libertad.tnp
Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdl
fitlm
stepwiselm
Busque la tabla debajo del objeto.Residuos
mdl
Obtenga cualquiera de estas columnas como vector indexando la propiedad utilizando la notación de puntos, por ejemplo,
mdl.Residuals.Raw
Trace cualquiera de los residuales para los valores ajustados por el modelo utilizando for details, vea el método de la clase.
plotResiduals(mdl)
plotResiduals
LinearModel
En este ejemplo se muestra cómo evaluar los supuestos del modelo examinando los residuos de un modelo de regresión lineal ajustada.
Cargue los datos de ejemplo y almacene las variables independientes y de respuesta en una tabla.
load imports-85 tbl = table(X(:,7),X(:,8),X(:,9),X(:,15),'VariableNames',... {'curb_weight','engine_size','bore','price'});
Ajuste un modelo de regresión lineal.
mdl = fitlm(tbl)
mdl = Linear regression model: price ~ 1 + curb_weight + engine_size + bore Estimated Coefficients: Estimate SE tStat pValue __________ _________ _______ __________ (Intercept) 64.095 3.703 17.309 2.0481e-41 curb_weight -0.0086681 0.0011025 -7.8623 2.42e-13 engine_size -0.015806 0.013255 -1.1925 0.23452 bore -2.6998 1.3489 -2.0015 0.046711 Number of observations: 201, Error degrees of freedom: 197 Root Mean Squared Error: 3.95 R-squared: 0.674, Adjusted R-Squared: 0.669 F-statistic vs. constant model: 136, p-value = 1.14e-47
Trace el histograma de los residuos brutos.
plotResiduals(mdl)
El histograma muestra que los residuos son levemente sesgados.
Trace el diagrama de caja de los cuatro tipos de residuos.
Res = table2array(mdl.Residuals); boxplot(Res)
También puede ver la estructura sesgada a la derecha de los residuos en el diagrama de caja.
Trace la gráfica de probabilidad normal de los residuos sin procesar.
plotResiduals(mdl,'probability')
Esta gráfica de probabilidad normal también muestra la desviación de la normalidad y la asimetría en la cola derecha de la distribución de los residuos.
Trace los residuos en comparación con los residuales retrasados.
plotResiduals(mdl,'lagged')
Este gráfico muestra una tendencia, que indica una posible correlación entre los residuos. Puede comprobar esto utilizando.dwtest(mdl)
La correlación serial entre los residuos generalmente significa que el modelo puede mejorarse.
Trace la gráfica de simetría de los residuos.
plotResiduals(mdl,'symmetry')
Esta gráfica también sugiere que los residuos no se distribuyen por igual alrededor de su mediana, como se espera para la distribución normal.
Trace los residuos frente a los valores ajustados.
plotResiduals(mdl,'fitted')
El aumento de la varianza como el aumento de los valores ajustados sugiere una posible heteroscedasticidad.
[1] Atkinson, A. T. Plots, Transformations, and Regression. An Introduction to Graphical Methods of Diagnostic Regression Analysis. New York: Oxford Statistical Science Series, Oxford University Press, 1987.
[2] Neter, J., M. H. Kutner, C. J. Nachtsheim, and W. Wasserman. Applied Linear Statistical Models. IRWIN, The McGraw-Hill Companies, Inc., 1996.
[3] Belsley, D. A., E. Kuh, and R. E. Welsch. Regression Diagnostics, Identifying Influential Data and Sources of Collinearity. Wiley Series in Probability and Mathematical Statistics, John Wiley and Sons, Inc., 1980.
LinearModel
| dwtest
| fitlm
| plotDiagnostics
| plotResiduals
| stepwiselm