Coeficiente de determinación (R cuadrado)
Propósito
El coeficiente de determinación (R cuadrado) indica la cantidad proporcional de variación en la variable de respuesta y, explicada según las variables independientes X en el modelo de regresión lineal. Cuanto mayor sea el R cuadrado, mayor será la variabilidad explicada por el modelo de regresión lineal.
Definición
El R cuadrado es la proporción de la suma total de los cuadrados explicada por el modelo. Rsquared
, una propiedad del modelo ajustado, es una estructura de dos campos:
Ordinary
: R cuadrado ordinario (no ajustado)Adjusted
: R cuadrado ajustado por el número de coeficientesSSE es la suma de cuadrados de error, SSR es la suma de cuadrados de regresión, SST es la suma de cuadrados total, n es el número de observaciones y p es el número de coeficientes de regresión. Tenga en cuenta que p incluye el intercepto; por lo que, por ejemplo, p es 2 para un ajuste lineal. Dado que el R cuadrado aumenta cuando se añaden variables predictoras al modelo de regresión, el R cuadrado ajustado se ajusta al número de variables predictoras del modelo. Esto lo hace más útil para comparar modelos con un número diferente de predictores.
Cómo se hace
Tras obtener un modelo ajustado (mdl
, por ejemplo) mediante fitlm
o stepwiselm
, se puede obtener cualquiera de los valores de R cuadrado como escalar mediante la indexación en la propiedad usando la notación de puntos; por ejemplo,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
También puede obtener SSE, SSR y SST usando las propiedades con el mismo nombre.
mdl.SSE mdl.SSR mdl.SST
Mostrar el coeficiente de determinación
En el siguiente ejemplo se indica cómo mostrar el R cuadrado (coeficiente de determinación) y el R cuadrado ajustado. Cargue los datos de muestra y defina las variables independientes y de respuesta.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
Ajuste un modelo de regresión lineal.
mdl = fitlm(X,y)
mdl = Linear regression model: y ~ 1 + x1 + x2 + x3 + x4 Estimated Coefficients: Estimate SE tStat pValue _________ ________ ________ __________ (Intercept) 117.4 5.2451 22.383 1.1667e-39 x1 0.88162 2.9473 0.29913 0.76549 x2 0.08602 0.06731 1.278 0.20438 x3 -0.016685 0.055714 -0.29947 0.76524 x4 9.884 1.0406 9.498 1.9546e-15 Number of observations: 100, Error degrees of freedom: 95 Root Mean Squared Error: 4.81 R-squared: 0.508, Adjusted R-Squared: 0.487 F-statistic vs. constant model: 24.5, p-value = 5.99e-14
Los valores del R cuadrado y del R cuadrado ajustado son 0,508 y 0,487, respectivamente. El modelo explica alrededor del 50% de la variabilidad en la variable de respuesta.
Acceda a los valores del R cuadrado y del R cuadrado ajustado mediante la propiedad del objeto LinearModel
ajustado.
mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871
El valor del R cuadrado ajustado es menor que el valor del R cuadrado ordinario.
Consulte también
LinearModel
| fitlm
| stepwiselm
| anova