Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

-Way ANOVAN

Introducción a ANOVA de formaN

Puede utilizar la función para realizar el ANOVA de forma.Statistics and Machine Learning Toolbox™anovanN ANOVA de uso para determinar si los medios de un conjunto de datos difieren con respecto a los grupos (niveles) de varios factores.N De forma predeterminada, trata todas las variables de agrupamiento como efectos fijos.anovan Para ver un ejemplo de ANOVA con efectos aleatorios, consulte.ANOVA con efectos aleatorios Para las medidas repetidas, ver yfitrm ranova.

ANOVA de forma generalizada es una generalización de ANOVA de dos vías.N Para tres factores, por ejemplo, el modelo se puede escribir como

yijkr=μ+αi+βj+γk+(αβ)ij+(αγ)ik+(βγ)jk+(αβγ)ijk+εijkr,

Dónde

  • yijkr es una observación de la variable de respuesta. representa el grupo de factor, = 1, 2,...,, representa grupo de factor, = 1, 2,...,, representa el grupo de factor C y representa el número de replicación, = 1, 2,...,.iiAiIjjBjJkkrrR Para constante, hay un total de = * * * observaciones, pero el número de observaciones no tiene que ser el mismo para cada combinación de grupos de factores.RNIJKR

  • es la media general.μ

  • Αi son las desviaciones de los grupos de factores de la media general debida al factor.AμA Los valores de Αi suma a 0.

    i=1Iαi=0.

  • Βj son las desviaciones de los grupos en factor de la media general debida al factor.BμB Los valores de Βj suma a 0.

    j=1Jβj=0.

  • Γk son las desviaciones de los grupos en factor de la media general debida al factor.CμC Los valores de Γk suma a 0.

    k=1Kγk=0.

  • ( )αβij es el término de interacción entre los factores y. ( )ABαβij suma a 0 sobre cualquiera de los índices.

    i=1I(αβ)ij=j=1J(αβ)ij=0.

  • ( )αγik es el término de interacción entre los factores y.AC Los valores de ()αγik suma a 0 sobre cualquiera de los índices.

    i=1I(αγ)ik=k=1K(αγ)ik=0.

  • ( )βγjk es el término de interacción entre los factores y.BC Los valores de ()βγjk suma a 0 sobre cualquiera de los índices.

    j=1J(βγ)jk=k=1K(βγ)jk=0.

  • ( )αβγijk es el término de interacción de tres vías entre los factores, y.ABC Los valores de ()αβγijk suma a 0 sobre cualquier índice.

    i=1I(αβγ)ijk=j=1J(αβγ)ijk=k=1K(αβγ)ijk=0.

  • Εijkr son las perturbaciones aleatorias. Se supone que son independientes, normalmente distribuidas y tienen una varianza constante.

El ANOVA de tres vías prueba las hipótesis sobre los efectos de los factores, y sus interacciones en la variable de respuesta.ABCy Las hipótesis sobre la igualdad de las respuestas medias para los grupos de factores sonA

H0:α1=α2=αIH1: at least one αi is different, i=1, 2, ..., I.

Las hipótesis sobre la igualdad de la respuesta media para los grupos de factores sonB

H0:β1=β2==βJH1: at least one βj is different,  j=1, 2, ..., J.

Las hipótesis sobre la igualdad de la respuesta media para los grupos de factores sonC

H0:γ1=γ2==γKH1: at least one γk is different, k=1, 2, ..., K.

Las hipótesis sobre la interacción de los factores son

H0:(αβ)ij=0H1:at least one (αβ)ij0

H0:(αγ)ik=0H1:at least one (αγ)ik0H0:(βγ)jk=0H1:at least one (βγ)jk0H0:(αβγ)ijk=0H1:at least one (αβγ)ijk0

En estos parámetros de notación con dos subsubscriptos, como ()αβij, representan el efecto de interacción de dos factores. El parámetro ()αβγijk representa la interacción de tres vías. Un modelo ANOVA puede tener el conjunto completo de parámetros o cualquier subconjunto, pero convencionalmente no incluye términos de interacción complejos a menos que también incluya todos los términos más simples para esos factores. Por ejemplo, uno generalmente no incluiría la interacción de tres vías sin incluir también todas las interacciones de dos vías.

Prepare los datos para N-Way ANOVA

A diferencia de y, no espera datos en forma tabular.anova1anova2anovan En su lugar, espera un vector de mediciones de respuesta y un vector separado (o matriz de texto) que contenga los valores correspondientes a cada factor. Este formato de datos de entrada es más conveniente que las matrices cuando hay más de dos factores o cuando el número de mediciones por combinación de factores no es constante.

y=[y1,y2,y3,y4,y5,,yN]g1={'A','A','C','B','B',,'D'}g2=[12131,2]g3={'hi','mid','low','mid','hi',,'low'}

Realice N-Way ANOVA

Este ejemplo muestra cómo realizar N-Way ANOVA en datos de automóviles con kilometraje y otra información sobre 406 coches hechos entre 1970 y 1982.

Cargue los datos de ejemplo.

load carbig

El ejemplo se centra en cuatro variables. es el número de millas por galón para cada uno de 406 coches (aunque algunos tienen valores faltantes codificados como).MPGNaN Las otras tres variables son factores: (coche de cuatro cilindros o no), (coche originado en Europa, Japón, o los EE.UU.), y (coche fue construido temprano en el período, en el medio del período, o tarde en el período).cyl4orgwhen

Ajuste el modelo completo, solicitando hasta tres interacciones y escriba 3 sumas de cuadrados.

varnames = {'Origin';'4Cyl';'MfgDate'}; anovan(MPG,{org cyl4 when},3,3,varnames)

ans = 7×1

    0.0000
       NaN
    0.0000
    0.7032
    0.0001
    0.2072
    0.6990

Tenga en cuenta que muchos términos están marcados por un símbolo # como no tener rango completo, y uno de ellos tiene cero grados de libertad y le falta un valor.p Esto puede suceder cuando faltan combinaciones de factores y el modelo tiene términos de orden superior. En este caso, la tabulación cruzada a continuación muestra que no hay automóviles fabricados en Europa durante la primera parte del período con otros cuatro cilindros, como indica el 0 in.tbl(2,1,1)

[tbl,chi2,p,factorvals] = crosstab(org,when,cyl4)
tbl =  tbl(:,:,1) =      82    75    25      0     4     3      3     3     4   tbl(:,:,2) =      12    22    38     23    26    17     12    25    32  
chi2 = 207.7689 
p = 8.0973e-38 
factorvals = 3x3 cell array
    {'USA'   }    {'Early'}    {'Other'   }
    {'Europe'}    {'Mid'  }    {'Four'    }
    {'Japan' }    {'Late' }    {0x0 double}

Por lo tanto, es imposible estimar los efectos de interacción de tres vías, e incluso el término de interacción de tres vías en el modelo hace que el ajuste sea singular.

Utilizando incluso la información limitada disponible en la tabla ANOVA, puede ver que la interacción de tres vías tiene un valor de 0,699, por lo que no es significativa.p

Examine solo las interacciones bidireccionales.

[p,tbl2,stats,terms] = anovan(MPG,{org cyl4 when},2,3,varnames);

terms
terms = 6×3

     1     0     0
     0     1     0
     0     0     1
     1     1     0
     1     0     1
     0     1     1

Ahora todos los términos son estimable. Los-valores para el término de interacción 4 () y el término de interacción 6 () son mucho mayores que un valor límite típico de 0,05, lo que indica que estos términos no son significativos.pOrigin*4Cyl4Cyl*MfgDate Puede optar por omitir estos términos y el grupo de sus efectos en el término de error. La variable de salida devuelve una matriz de códigos, cada uno de los cuales es un patrón de bits que representa un término.terms

Omita los términos del modelo eliminando sus entradas.terms

terms([4 6],:) = []
terms = 4×3

     1     0     0
     0     1     0
     0     0     1
     1     0     1

Ejecute de nuevo, esta vez suministrando el vector resultante como argumento del modelo.anovan También devuelva las estadísticas requeridas para comparaciones múltiples de factores.

[~,~,stats] = anovan(MPG,{org cyl4 when},terms,3,varnames)

stats = struct with fields:
         source: 'anovan'
          resid: [1x406 double]
         coeffs: [18x1 double]
            Rtr: [10x10 double]
       rowbasis: [10x18 double]
            dfe: 388
            mse: 14.1056
    nullproject: [18x10 double]
          terms: [4x3 double]
        nlevels: [3x1 double]
     continuous: [0 0 0]
         vmeans: [3x1 double]
       termcols: [5x1 double]
     coeffnames: {18x1 cell}
           vars: [18x3 double]
       varnames: {3x1 cell}
       grpnames: {3x1 cell}
        vnested: []
            ems: []
          denom: []
        dfdenom: []
        msdenom: []
         varest: []
          varci: []
       txtdenom: []
         txtems: []
        rtnames: []

Ahora usted tiene un modelo más parsimonioso que indica que el kilometraje de estos coches parece estar relacionado con los tres factores, y que el efecto de la fecha de fabricación depende de dónde se hizo el coche.

Realice comparaciones múltiples para origen y cilindro.

results = multcompare(stats,'Dimension',[1,2])

results = 15×6

    1.0000    2.0000   -5.4891   -3.8412   -2.1932    0.0000
    1.0000    3.0000   -4.4146   -2.7251   -1.0356    0.0001
    1.0000    4.0000   -9.9992   -8.5828   -7.1664    0.0000
    1.0000    5.0000  -14.0237  -12.4240  -10.8242    0.0000
    1.0000    6.0000  -12.8980  -11.3080   -9.7180    0.0000
    2.0000    3.0000   -0.7171    1.1160    2.9492    0.5085
    2.0000    4.0000   -7.3655   -4.7417   -2.1179    0.0000
    2.0000    5.0000   -9.9992   -8.5828   -7.1664    0.0000
    2.0000    6.0000   -9.7464   -7.4668   -5.1872    0.0000
    3.0000    4.0000   -8.5396   -5.8577   -3.1757    0.0000
      ⋮

Consulte también

| | |

Ejemplos relacionados

Más acerca de