Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Delete-1 estadísticas

Delete-1 cambio en la covarianza (covratio)

Propósito

El cambio Delete-1 en covarianza () identifica las observaciones que son influyentes en el ajuste de regresión.covratio Una observación influyente es aquella en la que su exclusión del modelo podría alterar significativamente la función de regresión. Los valores de covratio mayores que 1 + 3 */o menores que 1 – 3 */indican puntos influyentes, donde está el número de coeficientes de regresión, y es el número de observaciones.pnpnpn

Definición

La estadística de covratio es la relación del determinante de la matriz de covarianza de coeficiente con la observación eliminada al determinante de la matriz de covarianzas para el modelo completo:i

covratio=det{MSE(i)[X(i)X(i)]1}det[MSE(XX)1].

es un vector-by-1 en la tabla del objeto ajustado.CovRationDiagnosticsLinearModel Cada elemento es la relación de la varianza generalizada de los coeficientes estimados cuando el elemento correspondiente se elimina a la varianza generalizada de los coeficientes utilizando todos los datos.

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Mostrar la indexación en la propiedad mediante la notación de puntosCovRatio

    mdl.Diagnostics.CovRatio

  • Trace el cambio Delete-1 en la covarianza usando for details, vea el método de la clase.

    plotDiagnostics(mdl,'CovRatio')
    plotDiagnosticsLinearModel

Determine las observaciones influyentes utilizando CovRatio

En este ejemplo se muestra cómo utilizar las estadísticas para determinar los puntos influyentes de los datos.CovRatio Cargue los datos de ejemplo y defina las variables de respuesta y predictores.

load hospital y = hospital.BloodPressure(:,1); X = double(hospital(:,2:5));

Ajuste un modelo de regresión lineal.

mdl = fitlm(X,y);

Graficar las estadísticas.CovRatio

plotDiagnostics(mdl,'CovRatio')

Para este ejemplo, los límites de umbral son 1 + 3 * 5/100 = 1,15 y 1-3 * 5/100 = 0,85. Hay algunos puntos más allá de los límites, que podrían ser puntos influyentes.

Encuentra las observaciones que están más allá de los límites.

find((mdl.Diagnostics.CovRatio)>1.15|(mdl.Diagnostics.CovRatio)<0.85)
ans = 5×1

     2
    14
    84
    93
    96

Delete-1 diferencia de escala en las estimaciones de coeficiente (Dfbetas)

Propósito

El signo de una diferencia a escala de eliminación-1 en la estimación de coeficiente (Dfbetas) para el coeficiente y la observación indica si esa observación provoca un aumento o una disminución en la estimación del coeficiente de regresión.ji El valor absoluto de un Dfbetas indica la magnitud de la diferencia con respecto a la desviación estándar estimada del coeficiente de regresión. Un valor de Dfbetas mayor que 3/sqrt () en valor absoluto indica que la observación tiene una gran influencia en el coeficiente correspondiente.n

Definición

Dfbetas para el coeficiente y la observación es la relación de la diferencia en la estimación de coeficiente utilizando todas las observaciones y la obtenida mediante la eliminación de la observación, y el error estándar de la estimación del coeficiente obtenida mediante la eliminación de la observación.jijii El Dfbetas para el coeficiente y la observación esji

Dfbetasij=bjbj(i)MSE(i)(1hii),

Dóndebj es la estimación del coeficiente,jbj(i) es la estimación del coeficiente eliminando la observación,jiMSE(i) es el error cuadrado medio de la regresión ajustar eliminando la observación, yihii es el valor de apalancamiento para la observación. es una-por-matriz en la tabla del objeto ajustado.iDfbetasnpDiagnosticsLinearModel Cada celda de corresponde al valor Dfbetas para el coeficiente correspondiente obtenido mediante la eliminación de la observación correspondiente.Dfbetas

Cómo

Después de obtener un modelo ajustado, digamos, usando o, puede obtener los valores de Dfbetas como un-por-matriz indexando en la propiedad utilizando la notación de puntos,mdlfitlmstepwiselmnp

mdl.Diagnostics.Dfbetas

Determine las observaciones influyentes en los coeficientes utilizando Dfbetas

Este ejemplo muestra cómo determinar las observaciones que tienen gran influencia en los coeficientes utilizando.Dfbetas Cargue los datos de ejemplo y defina la respuesta y las variables independientes.

load hospital y = hospital.BloodPressure(:,1); X = double(hospital(:,2:5));

Ajuste un modelo de regresión lineal.

mdl = fitlm(X,y);

Encuentre los valores altos en valor absoluto.Dfbetas

[row,col] = find(abs(mdl.Diagnostics.Dfbetas)>3/sqrt(100)); disp([row col])
     2     1     28     1     84     1     93     1      2     2     13     3     84     3      2     4     84     4 

Delete-1 cambio escalado en valores ajustados (Dffits)

Propósito

El cambio escalado de DELETE-1 en los valores ajustados (Dffits) muestra la influencia de cada observación en los valores de respuesta ajustados. Los valores de dffits con un valor absoluto superior a 2 * sqrt (/) podrían ser influyentes.pn

Definición

Dffits para la observación esi

Dffitsi=srihii1hii,

Dóndesri es el residuo estudentizado, yhii es el valor de apalancamiento del objeto ajustado. es un vector de columna-por-1 en la tabla del objeto ajustado.LinearModelDffitsnDiagnosticsLinearModel Cada elemento en es el cambio en el valor ajustado causado por la eliminación de la observación correspondiente y el escalado por el error estándar.Dffits

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Muestre los valores indexando la propiedad mediante la notación de puntosDffits

    mdl.Diagnostics.Dffits

  • Trace el cambio escalado de DELETE-1 en los valores ajustados con for details, vea el método de la clase para obtener más información.

    plotDiagnostics(mdl,'Dffits')
    plotDiagnosticsLinearModel

Determine las observaciones influyentes en la respuesta ajustada utilizando Dffits

Este ejemplo muestra cómo determinar las observaciones que son influyentes en los valores de respuesta ajustada mediante valores.Dffits Cargue los datos de ejemplo y defina la respuesta y las variables independientes.

load hospital y = hospital.BloodPressure(:,1); X = double(hospital(:,2:5));

Ajuste un modelo de regresión lineal.

mdl = fitlm(X,y);

Trace los valores de Dffits.

plotDiagnostics(mdl,'Dffits')

El límite de umbral influyente para el valor absoluto de Dffits en este ejemplo es 2 * sqrt (5/100) = 0,45. Una vez más, hay algunas observaciones con valores de Dffits más allá de los límites recomendados.

Busque los valores de Dffits que son grandes en valor absoluto.

find(abs(mdl.Diagnostics.Dffits)>2*sqrt(4/100))
ans = 10×1

     2
    13
    28
    44
    58
    70
    71
    84
    93
    95

Delete-1 varianza ()S2_i

Propósito

La varianza Delete-1 () muestra cómo cambia el error medio cuadrado cuando se elimina una observación del conjunto de datos.S2_i Puede comparar los valores con el valor del error cuadrado medio.S2_i

Definición

es un conjunto de estimaciones de desviación residual obtenidas eliminando cada observación a su vez.S2_i El valor de la observación esS2_ii

S2_i=MSE(i)=jin[yjy^j(i)]2np1,

Dóndeyj es el valor de respuesta observado. es un vector-by-1 en la tabla del objeto ajustado.jS2_inDiagnosticsLinearModel Cada elemento en es el error cuadrado medio de la regresión obtenida al eliminar esa observación.S2_i

Cómo

Después de obtener un modelo ajustado, digamos, usando o, usted puede:mdlfitlmstepwiselm

  • Visualice el vector indexando la propiedad utilizando la notación de puntosS2_i

    mdl.Diagnostics.S2_i

  • Trace los valores de varianza Delete-1 utilizando for details, vea el método de la clase.

    plotDiagnostics(mdl,'S2_i')
    plotDiagnosticsLinearModel

Calcular y examinar los valores de varianza Delete-1

Este ejemplo muestra cómo calcular y trazar los valores de S2_i para examinar el cambio en el error cuadrado medio cuando se quita una observación de los datos. Cargue los datos de ejemplo y defina la respuesta y las variables independientes.

load hospital y = hospital.BloodPressure(:,1); X = double(hospital(:,2:5));

Ajuste un modelo de regresión lineal.

mdl = fitlm(X,y);

Visualice el valor MSE para el modelo.

mdl.MSE
ans = 23.1140 

Trace los valores S2_i.

plotDiagnostics(mdl,'S2_i')

Esta trama hace que sea fácil comparar los valores de S2_i con el valor MSE de 23,114, indicado por las líneas discontinuas horizontales. Puede ver cómo la eliminación de una observación cambia la varianza del error.

Consulte también

| | | |

Temas relacionados