Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

anova

Análisis de varianza para el modelo de regresión lineal

Descripción

ejemplo

tbl = anova(mdl) Devuelve una tabla con estadísticas de ANOVA de componentes.

ejemplo

tbl = anova(mdl,anovatype) Devuelve las estadísticas de ANOVA del tipo especificado.anovatype Por ejemplo, especifique como (valor predeterminado) para devolver una tabla con estadísticas de ANOVA de componente, o especifique como para devolver una tabla con estadísticas de ANOVA de resumen.anovatype'component'anovatype'summary'

tbl = anova(mdl,'component',sstype) calcula las estadísticas de ANOVA de componentes utilizando el tipo especificado de suma de cuadrados.

Ejemplos

contraer todo

Cree una tabla ANOVA de componentes a partir de un modelo de regresión lineal del conjunto de datos.hospital

Cargue el conjunto de datos y cree un modelo de presión arterial en función de la edad y el sexo.hospital

load hospital tbl = table(hospital.Age,hospital.Sex,hospital.BloodPressure(:,2), ...     'VariableNames',{'Age','Sex','BloodPressure'}); tbl.Sex = categorical(tbl.Sex); mdl = fitlm(tbl,'BloodPressure ~ Sex + Age^2')
mdl =  Linear regression model:     BloodPressure ~ 1 + Age + Sex + Age^2  Estimated Coefficients:                    Estimate        SE        tStat       pValue                      _________    ________    ________    _________      (Intercept)       63.942      19.194      3.3314    0.0012275     Age              0.90673      1.0442     0.86837      0.38736     Sex_Male          3.0019      1.3765      2.1808     0.031643     Age^2          -0.011275    0.013853    -0.81389      0.41772   Number of observations: 100, Error degrees of freedom: 96 Root Mean Squared Error: 6.83 R-squared: 0.0577,  Adjusted R-Squared: 0.0283 F-statistic vs. constant model: 1.96, p-value = 0.125 

Cree una tabla ANOVA del modelo.

tbl = anova(mdl)
tbl=4×5 table
             SumSq     DF    MeanSq       F        pValue 
             ______    __    ______    _______    ________

    Age      18.705     1    18.705    0.40055     0.52831
    Sex      222.09     1    222.09     4.7558    0.031643
    Age^2    30.934     1    30.934    0.66242     0.41772
    Error    4483.1    96    46.699                       

La tabla muestra las siguientes columnas para cada término excepto el término constante (intercepción):

  • — Suma de los cuadrados explicados por el término.SumSq

  • — Grados de libertad.DF En este ejemplo, es 1 para cada término en el modelo y – para el término de error, donde está el número de observaciones y es el número de coeficientes (incluyendo la intercepción) en el modelo.DFn pnp Por ejemplo, para el término de error en este modelo es 100 – 4 = 96.DF Si alguna variable en el modelo es una variable categórica, la para esa variable es el número de variables indicadoras creadas para sus categorías (número de categorías – 1).DF

  • — Cuadrado medio, definido por.MeanSqMeanSq = SumSq/DF Por ejemplo, el cuadrado medio del término del error, el error cuadrado medio (MSE), es 4.4831 e + 03/96 = 46,6991.

  • —-valor estadístico para probar la hipótesis nula de que el coeficiente correspondiente es cero, calculado por, donde es el error cuadrado medio.FFF = MeanSq/MSEMSE Cuando la hipótesis nula es verdadera, la-estadística sigue la-distribución.FF El numerador grados de libertad es el valor para el término correspondiente, y el denominador grados de libertad es – en este ejemplo, cada-estadística sigue unDFn p.F

    <math display="block">
    <mrow>
    <msub>
    <mrow>
    <mi>F</mi>
    </mrow>
    <mrow>
    <mo stretchy="false">(</mo>
    <mn>1</mn>
    <mo>,</mo>
    <mn>9</mn>
    <mn>6</mn>
    <mo stretchy="false">)</mo>
    </mrow>
    </msub>
    </mrow>
    </math>
    distribución.

  • —-valor del valor-estadístico.pValuepF Por ejemplo, el-valor para es 0,5283, lo que implica que no es significativo en el nivel de significancia del 5% dado los otros términos en el modelo.pAgeAge

Cree una tabla de Resumen de ANOVA a partir de un modelo de regresión lineal del conjunto de datos.hospital

Cargue el conjunto de datos y cree un modelo de presión arterial en función de la edad y el sexo.hospital

load hospital tbl = table(hospital.Age,hospital.Sex,hospital.BloodPressure(:,2), ...     'VariableNames',{'Age','Sex','BloodPressure'}); tbl.Sex = categorical(tbl.Sex); mdl = fitlm(tbl,'BloodPressure ~ Sex + Age^2')
mdl =  Linear regression model:     BloodPressure ~ 1 + Age + Sex + Age^2  Estimated Coefficients:                    Estimate        SE        tStat       pValue                      _________    ________    ________    _________      (Intercept)       63.942      19.194      3.3314    0.0012275     Age              0.90673      1.0442     0.86837      0.38736     Sex_Male          3.0019      1.3765      2.1808     0.031643     Age^2          -0.011275    0.013853    -0.81389      0.41772   Number of observations: 100, Error degrees of freedom: 96 Root Mean Squared Error: 6.83 R-squared: 0.0577,  Adjusted R-Squared: 0.0283 F-statistic vs. constant model: 1.96, p-value = 0.125 

Cree una tabla de Resumen de ANOVA del modelo.

tbl = anova(mdl,'summary')
tbl=7×5 table
                     SumSq     DF    MeanSq       F        pValue 
                     ______    __    ______    _______    ________

    Total            4757.8    99    48.059                       
    Model            274.73     3    91.577      1.961     0.12501
    . Linear          243.8     2     121.9     2.6103    0.078726
    . Nonlinear      30.934     1    30.934    0.66242     0.41772
    Residual         4483.1    96    46.699                       
    . Lack of fit    1483.1    39    38.028    0.72253     0.85732
    . Pure error       3000    57    52.632                       

La tabla muestra pruebas para grupos de términos:, y.TotalModelResidual

  • — Esta fila muestra la suma total de los cuadrados (), grados de libertad () y el error cuadrado medio ().TotalSumSqDFMeanSq Tenga en cuenta que.MeanSq = SumSq/DF

  • — Esta fila incluye,,,-valor estadístico (), y-valor ().ModelSumSqDFMeanSqFFppValue Dado que este modelo incluye un término no lineal (), divide la suma de los cuadrados () en dos partes: explicadas por los términos lineales (y) y explicadas por el término no lineal ().Age^2anovaSumSqModelSumSqAgeSexSumSqAge^2 Los valores estadísticos correspondientes son para probar la significancia de los términos lineales y el término no lineal como grupos separados.F El grupo no lineal consta del término sólo, por lo que tiene el mismo valor que el término en el.Age^2pAge^2Tabla de componentes ANOVA

  • : Esta fila incluye,,, y.ResidualSumSqDFMeanSqFpValue Dado que el conjunto de datos incluye replicaciones, particiona el residuo en la pieza para las replicaciones () y el resto ().anovaSumSqPure errorLack of fit Para probar la falta de ajuste, calcula el valor-estadístico comparando los residuales del modelo con la estimación de desviación sin modelo calculada en las replicaciones.anovaF El valor-estadístico no muestra evidencia de falta de ajuste.F

Ajuste un modelo de regresión lineal que contenga un predictor categórico. Reordenar las categorías del predictor categórico para controlar el nivel de referencia en el modelo. A continuación, utilice para probar la significancia de la variable categórica.anova

Modelo con predictor categórico

Cargue el conjunto de datos y cree un modelo de regresión lineal como función de.carsmallMPGModel_Year Para tratar el vector numérico como una variable categórica, identifique el predictor utilizando el argumento de par nombre-valor.Model_Year'CategoricalVars'

load carsmall mdl = fitlm(Model_Year,MPG,'CategoricalVars',1,'VarNames',{'Model_Year','MPG'})
mdl =  Linear regression model:     MPG ~ 1 + Model_Year  Estimated Coefficients:                      Estimate      SE      tStat       pValue                        ________    ______    ______    __________      (Intercept)        17.69     1.0328    17.127    3.2371e-30     Model_Year_76     3.8839     1.4059    2.7625     0.0069402     Model_Year_82      14.02     1.4369    9.7571    8.2164e-16   Number of observations: 94, Error degrees of freedom: 91 Root Mean Squared Error: 5.56 R-squared: 0.531,  Adjusted R-Squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15 

La fórmula del modelo en la pantalla, corresponde aMPG ~ 1 + Model_Year

<math display="inline">
<mrow>
<mi mathvariant="normal">MPG</mi>
<mo>=</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>76</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>82</mn>
</mrow>
</msub>
<mo>+</mo>
<mi>ϵ</mi>
</mrow>
</math>
,

Dónde

<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>76</mn>
</mrow>
</msub>
</mrow>
</math>
Y
<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>82</mn>
</mrow>
</msub>
</mrow>
</math>
son variables indicadoras cuyo valor es uno si el valor es 76 y 82, respectivamente.Model_Year La variable incluye tres valores distintos, que puede comprobar mediante la función.Model_Yearunique

unique(Model_Year)
ans = 3×1

    70
    76
    82

elige el valor más pequeño como nivel de referencia () y crea dos variables indicadorasfitlmModel_Year'70'

<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>76</mn>
</mrow>
</msub>
</mrow>
</math>
Y
<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>82</mn>
</mrow>
</msub>
</mrow>
</math>
. El modelo incluye sólo dos variables indicadoras porque la matriz de diseño se convierte en deficiente rango Si el modelo incluye tres variables indicadoras (una para cada nivel) y un término de intercepción.

Modelo con variables indicadoras completas

Puede interpretar la fórmula del modelo como un modelo que tiene tres variables indicadoras sin un término de intercepción:mdl

<math display="inline">
<mrow>
<mi mathvariant="italic">y</mi>
<mo>=</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<msub>
<mrow>
<mi mathvariant="italic">x</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
<mo>=</mo>
<mn>70</mn>
</mrow>
</msub>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<msub>
<mrow>
<mi mathvariant="italic">x</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
<mo>=</mo>
<mn>76</mn>
</mrow>
</msub>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
<mo>+</mo>
<mi>β</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<msub>
<mrow>
<mi mathvariant="italic">x</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
<mo>=</mo>
<mn>82</mn>
</mrow>
</msub>
<mo>+</mo>
<mi>ϵ</mi>
</mrow>
</math>
.

Alternativamente, puede crear un modelo que tenga tres variables indicadoras sin un término de intercepción mediante la creación manual de variables indicadoras y especificando la fórmula del modelo.

temp_Year = dummyvar(categorical(Model_Year)); Model_Year_70 = temp_Year(:,1); Model_Year_76 = temp_Year(:,2); Model_Year_82 = temp_Year(:,3); tbl = table(Model_Year_70,Model_Year_76,Model_Year_82,MPG); mdl = fitlm(tbl,'MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 - 1')
mdl =  Linear regression model:     MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82  Estimated Coefficients:                      Estimate      SE       tStat       pValue                        ________    _______    ______    __________      Model_Year_70      17.69      1.0328    17.127    3.2371e-30     Model_Year_76     21.574     0.95387    22.617    4.0156e-39     Model_Year_82      31.71     0.99896    31.743    5.2234e-51   Number of observations: 94, Error degrees of freedom: 91 Root Mean Squared Error: 5.56 

Elija nivel de referencia en modelo

Puede elegir un nivel de referencia modificando el orden de las categorías en una variable categórica. En primer lugar, cree una variable categórica.Year

Year = categorical(Model_Year);

Compruebe el orden de las categorías mediante la función.categories

categories(Year)
ans = 3x1 cell array
    {'70'}
    {'76'}
    {'82'}

Si utiliza como variable predictora, elige la primera categoría como nivel de referencia.Yearfitlm'70' Reordenar mediante la función.Yearreordercats

Year_reordered = reordercats(Year,{'76','70','82'}); categories(Year_reordered)
ans = 3x1 cell array
    {'76'}
    {'70'}
    {'82'}

La primera categoría es.Year_reordered'76' Cree un modelo de regresión lineal como función de.MPGYear_reordered

mdl2 = fitlm(Year_reordered,MPG,'VarNames',{'Model_Year','MPG'})
mdl2 =  Linear regression model:     MPG ~ 1 + Model_Year  Estimated Coefficients:                      Estimate      SE        tStat       pValue                        ________    _______    _______    __________      (Intercept)       21.574     0.95387     22.617    4.0156e-39     Model_Year_70    -3.8839      1.4059    -2.7625     0.0069402     Model_Year_82     10.136      1.3812     7.3385    8.7634e-11   Number of observations: 94, Error degrees of freedom: 91 Root Mean Squared Error: 5.56 R-squared: 0.531,  Adjusted R-Squared: 0.521 F-statistic vs. constant model: 51.6, p-value = 1.07e-15 

utiliza como nivel de referencia e incluye dos variables indicadorasmdl2'76'

<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>70</mn>
</mrow>
</msub>
</mrow>
</math>
Y
<math display="inline">
<mrow>
<msub>
<mrow>
<mi>Ι</mi>
</mrow>
<mrow>
<mi mathvariant="normal">Year</mi>
<mo>=</mo>
<mn>82</mn>
</mrow>
</msub>
</mrow>
</math>
.

Evaluar predictor categórico

La visualización del modelo incluye un valor de cada término para comprobar si el coeficiente correspondiente es igual a cero.mdl2p Cada valor examina cada variable indicadora.p Para examinar la variable categórica como un grupo de variables indicadoras, utilice.Model_Yearanova Especifique para devolver una tabla ANOVA de componente que incluya estadísticas ANOVA para cada variable del modelo excepto el término constante.'components'

anova(mdl2,'components')
ans=2×5 table
                  SumSq     DF    MeanSq      F        pValue  
                  ______    __    ______    _____    __________

    Model_Year    3190.1     2    1595.1    51.56    1.0694e-15
    Error         2815.2    91    30.936                       

La tabla ANOVA de componentes incluye el-valor de la variable, que es menor que los valores-de las variables indicadoras.pModel_Yearp

Argumentos de entrada

contraer todo

Objeto de modelo de regresión lineal, especificado como un objeto creado mediante o, o un objeto creado medianteLinearModelfitlmstepwiselmCompactLinearModel compact.

Tipo ANOVA, especificado como uno de estos valores:

  • : devuelve la tabla con estadísticas de ANOVA para cada variable del modelo, excepto el término constante.'component'anovatbl

  • : devuelve la tabla con estadísticas de ANOVA de resumen para variables agrupadas y el modelo como un todo.'summary'anovatbl

Para obtener más información, consulte la descripción del argumento de salida.tbl

Suma del tipo de cuadrados para cada término, especificado como uno de los valores de esta tabla.

ValorDescripción
1Tipo 1 suma de cuadrados — reducción de la suma residual de los cuadrados obtenidos añadiendo el término a un ajuste que ya incluye los términos anteriores
2Tipo 2 suma de cuadrados — reducción de la suma residual de los cuadrados obtenidos añadiendo el término a un modelo que contiene todos los demás términos
3Tipo 3 suma de cuadrados — reducción de la suma residual de los cuadrados obtenidos añadiendo el término a un modelo que contiene todos los demás términos, pero con sus efectos limitados a obedecer las habituales "restricciones Sigma" que hacen que los modelos sean estimable
'h'Modelo jerárquico: similar al tipo 2, pero utiliza factores tanto continuos como categóricos para determinar la jerarquía de términos

La suma de los cuadrados para cualquier término se determina comparando dos modelos. Para un modelo que contiene efectos principales pero no interacciones, el valor de influye en los cálculos solo en datos desequilibrados.sstype

Supongamos que está encajando un modelo con dos factores y su interacción, y los términos aparecen en el orden,,.ABAB Supongamos que (·) representa la suma residual de los cuadrados para el modelo.R Por lo tanto, (,,) es la suma residual de los cuadrados que se ajusta a todo el modelo, () es la suma residual de los cuadrados que encaja el efecto principal de sólo, y (1) es la suma residual de los cuadrados que se ajusta a la media solamente.RA B ABRAAR Los tres tipos de suma de cuadrados son los siguientes:

TérminoTipo 1 suma de cuadradosTipo 2 suma de cuadradosTipo 3 suma de cuadrados

A

R(1) – R(A)

R(B) – R(A, B)

R(B, AB) – R(A, B, AB)

B

R(A) – R(A, B)

R(A) – R(A, B)

R(A, AB) – R(A, B, AB)

AB

R(A, B) – R(A, B, AB)

R(A, B) – R(A, B, AB)

R(A, B) – R(A, B, AB)

Los modelos para la suma de cuadrados tipo 3 tienen restricciones Sigma impuestas. Esto significa, por ejemplo, que en el ajuste (,), la matriz de efectos está restringida para sumar a 0 para cada valor de, y encima para cada valor de.RB ABABABBA

Para la suma de cuadrados tipo 3:

  • Si un objeto y el modelo de regresión no son jerárquicos, devuelve un error.mdlCompactLinearModelanova

  • Si un objeto y el modelo de regresión no son jerárquicos, rellena el modelo utilizando los efectos de codificación cada vez que necesite calcular una suma de cuadrados de tipo 3.mdlLinearModelanova

  • Si el modelo de regresión en es jerárquico, calcula los resultados sin volver a rellenar el modelo.mdlanova

se aplica sólo si es.sstypeanovatype'component'

Argumentos de salida

contraer todo

Tabla de Resumen de las estadísticas de ANOVA, devuelta como una tabla.

El contenido depende del tipo de ANOVA especificado en.tblanovatype

  • Si es así, contiene las estadísticas de ANOVA para cada variable en el modelo excepto el término de constante (intercepción).anovatype'component'tbl La tabla incluye estas columnas para cada variable:

    ColumnaDescripción
    SumSq

    Suma de los cuadrados explicados por el término, calculado segúnsstype

    DF

    Grados de libertad

    • de una variable numérica es 1.DF

    • de una variable categórica es el número de variables indicadoras creadas para la categoría (número de categorías – 1).DF Tenga en cuenta que contiene una fila por cada variable categórica en lugar de una fila para cada variable indicadora como en la visualización del modelo.tbl Se utiliza para probar una variable categórica como un grupo de variables indicadoras.anova

    • de un término de error esDF n – p, donde está el número de observaciones y es el número de coeficientes en el modelo.np

    MeanSq

    Cuadrado medio, definido por =/MeanSqSumSqDF

    para el término del error es el error cuadrado medio (MSE).MeanSq

    F

    -valor estadístico para probar la hipótesis nula de que el coeficiente correspondiente es cero, calculado por =/FFMeanSqMSE

    Cuando la hipótesis nula es verdadera, la-estadística sigue la-distribución.FF El numerador grados de libertad es el valor para el término correspondiente, y el denominador grados de libertad esDF n – p.

    pValue

    -valor del valor-estadísticopF

    Para ver un ejemplo, vea.Tabla de componentes ANOVA

  • Si es así, contiene estadísticas de Resumen de términos agrupados para cada fila.anovatype'summary'tbl La tabla incluye las mismas columnas que y estas filas:'component'

    FilaDescripción
    Total

    Las estadísticas totales

    • — Suma total de cuadrados, que es la suma de las desviaciones cuadradas de la respuesta alrededor de su mediaSumSq

    • — Suma de los grados de libertad yDFModelResidual

    Model

    Las estadísticas del modelo en su conjunto

    • — La suma de los cuadrados del modelo, que es la suma de las desviaciones cuadradas del valor ajustado alrededor de la media de la respuesta.SumSq

    • y — estos valores proporcionan una prueba de si el modelo como un todo encaja significativamente mejor que un modelo degenerado que consiste en sólo un término constante.FpValue

    Si sólo incluye términos lineales, entonces no se descompondrá en y.mdlanovaModelLinearNonLinear

    Linear

    Estadísticas de términos lineales

    • — Suma de los cuadrados para los términos lineales, que es la diferencia entre la suma de los cuadrados del modelo y la suma de los cuadrados para los términos no lineales.SumSq

    • y: estos valores proporcionan una prueba de si el modelo con solo términos lineales encaja mejor que un modelo degenerado que consta de solo un término constante. utiliza el error cuadrado medio que se basa en el modelo completo para calcular este valor, por lo que el valor obtenido al descartar los términos no lineales y repetir la prueba no es el mismo que el valor de esta fila.FpValueanovaFF

    Nonlinear

    Estadísticas de términos no lineales

    • — Suma de los cuadrados para los términos no lineales (orden superior o interacción), que es el aumento de la suma residual de los cuadrados obtenidos manteniendo sólo los términos lineales y dejando caer todos los términos no lineales.SumSq

    • y — estos valores proporcionan una prueba de si el modelo completo encaja significativamente mejor que un modelo más pequeño que consiste en sólo los términos lineales.FpValue

    Residual

    Las estadísticas de los residuos

    • — Suma de los cuadrados residuales, que es la suma de los valores residuales cuadradosSumSq

    • — Error medio cuadrado, utilizado para computar los valores-estadísticos para, yMeanSqFModelLinearNonLinear

    Si es un objeto completo y los datos de ejemplo contienen replicaciones (múltiples observaciones que comparten los mismos valores predictores), a continuación, descompone la suma de los cuadrados residual en una suma de cuadrados para las observaciones replicadas () y la suma restante de los cuadrados ().mdlLinearModelanovaLack of fitPure error

    Lack of fit

    Las estadísticas de falta de ajuste

    • — Suma de los cuadrados debido a la falta de ajuste, que es la diferencia entre la suma residual de los cuadrados y la suma de los cuadrados de la replicación.SumSq

    • y — el valor-estadístico es la relación entre la falta de ajuste y el error puro.FpValueFMeanSqMeanSq La relación proporciona una prueba de sesgo midiendo si la variación de los residuos es mayor que la variación de las replicaciones. Un valor bajo implica que la adición de términos adicionales al modelo puede mejorar el ajuste.p

    Pure error

    Las estadísticas de error puro

    • — Suma de los cuadrados de la replicación, obtenida encontrando los conjuntos de puntos con valores predictores idénticos, calculando la suma de las desviaciones cuadradas alrededor de la media dentro de cada conjunto, y reuniendo los valores calculadosSumSq

    • — Estimación de desviación de error pura sin modelo de la respuestaMeanSq

    Para ver un ejemplo, vea.Tabla de Resumen ANOVA

Funcionalidad alternativa

Las estadísticas más completas de ANOVA están disponibles en el, y las funciones.anova1anova2anovan

Introducido en R2012a