Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Comparaciones múltiples

Introducción

Las técnicas de análisis de varianza (ANOVA) prueban si un conjunto de medias de grupo (efectos de tratamiento) son iguales o no. El rechazo de la hipótesis nula conduce a la conclusión de que no todos los medios de grupo son iguales. Sin embargo, este resultado no proporciona más información sobre qué medios de grupo son diferentes.

No se recomienda realizar una serie de pruebas para determinar qué pares de medios son significativamente diferentes.t Al realizar pruebas múltiples, la probabilidad de que los medios parezcan significativos y los resultados de diferencias significativas podrían deberse a un gran número de pruebas.t Estas pruebas utilizan los datos de la misma muestra, por lo tanto, no son independientes.t Este hecho hace que sea más difícil cuantificar el nivel de significancia para múltiples pruebas.

Supongamos que en una sola prueba, la probabilidad de que la hipótesis nula (Ht0) se rechaza cuando en realidad es un valor pequeño, digamos 0,05. Supongamos también que se realizan seis pruebas independientes.t Si el nivel de significancia para cada prueba es 0,05, entonces la probabilidad de que las pruebas fallen correctamente para rechazar H0, cuando H0 es cierto para cada caso, es (0,95)6 = 0,735. Y la probabilidad de que una de las pruebas rechace incorrectamente la hipótesis nula es de 1 – 0,735 = 0,265, que es mucho mayor que 0,05.

Para compensar varias pruebas, puede usar varios procedimientos de comparación. La función realiza múltiples comparaciones en parejas de los medios de grupo, o efectos de tratamiento.Statistics and Machine Learning Toolbox™multcompare Las opciones son el criterio de diferencia honestamente significativo de Tukey (opción por defecto), el método Bonferroni, el procedimiento de Scheffe, el método de las diferencias menos significativas de Fisher (LSD) y el enfoque de Dunn & Sidak para la prueba.t

Para realizar comparaciones múltiples de medios de grupo, proporcione la estructura como entrada para.statsmultcompare Puede obtener una de las siguientes funciones:stats

Para opciones de procedimiento de comparación múltiple para medidas repetidas, consulte multcompare ( ).RepeatedMeasuresModel

Comparaciones múltiples usando ANOVA de un solo sentido

Cargue los datos de ejemplo.

load carsmall

representa las millas por galón para cada coche, y representa el número de cilindros en cada coche, ya sea 4, 6, u 8 cilindros.MPGCylinders

Pruebe si la media de millas por galón (MPG) es diferente en todos los coches que tienen un número diferente de cilindros. Calcule también las estadísticas necesarias para varias pruebas de comparación.

[p,~,stats] = anova1(MPG,Cylinders,'off'); p
p = 4.4902e-24 

El pequeño valor de aproximadamente 0 es una indicación fuerte de que la media de millas por galón es significativamente diferente a través de los coches con diferentes números de cilindros.p

Realizar una prueba de comparación múltiple, utilizando el método Bonferroni, para determinar qué números de cilindros hacen una diferencia en el rendimiento de los coches.

[results,means] = multcompare(stats,'CType','bonferroni')

results = 3×6

    1.0000    2.0000    4.8605    7.9418   11.0230    0.0000
    1.0000    3.0000   12.6127   15.2337   17.8548    0.0000
    2.0000    3.0000    3.8940    7.2919   10.6899    0.0000

means = 3×2

   29.5300    0.6363
   21.5882    1.0913
   14.2963    0.8660

En la matriz, 1, 2 y 3 corresponden a los coches con 4, 6 y 8 cilindros, respectivamente.results Las dos primeras columnas muestran qué grupos se comparan. Por ejemplo, la primera fila compara los coches con 4 y 6 cilindros. La cuarta columna muestra la diferencia de MPG media para los grupos comparados. Las columnas tercera y quinta muestran los límites inferior y superior para un intervalo de confianza del 95% para la diferencia en los medios del grupo. La última columna muestra los-valores para las pruebas.p Todos los valores son cero, lo que indica que el MPG medio para todos los grupos difiere en todos los grupos.p

En la figura de la barra azul representa el grupo de coches con 4 cilindros. Las barras rojas representan a los otros grupos. Ninguno de los intervalos de comparación rojos para el MPG medio de los coches se superponen, lo que significa que el MPG medio es significativamente diferente para los coches que tienen 4, 6 u 8 cilindros.

La primera columna de la matriz tiene las estimaciones medias de MPG para cada grupo de coches.means La segunda columna contiene los errores estándar de las estimaciones.

Comparaciones múltiples para ANOVA de tres vías

Cargue los datos de ejemplo.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]'; g1 = [1 2 1 2 1 2 1 2]; g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

es el vector de respuesta y, y son las variables de agrupamiento (factores).yg1g2g3 Cada factor tiene dos niveles, y cada observación en se identifica por una combinación de niveles de factores.y Por ejemplo, la observación está asociada con el nivel 1 del factor, el nivel de factor y el nivel de factor.y(1)g1'hi'g2'may'g3 Del mismo modo, la observación se asocia con el nivel 2 del factor, el nivel de factor y el nivel de factor.y(6)g1'hi'g2'june'g3

Pruebe si la respuesta es la misma para todos los niveles de factor. Calcule también las estadísticas necesarias para varias pruebas de comparación.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...     'varnames',{'g1','g2','g3'});

El-valor de 0,2578 indica que las respuestas medias de los niveles y del factor no son significativamente diferentes.p'may''june'g3 El-valor de 0,0347 indica que las respuestas medias de los niveles y del factor son significativamente diferentes.p12g1 Del mismo modo, el-valor de 0,0048 indica que las respuestas medias para los niveles y de factor son significativamente diferentes.p'hi''lo'g2

Realizar varias pruebas de comparación para averiguar qué grupos de los factores y son significativamente diferentes.g1g2

results = multcompare(stats,'Dimension',[1 2])

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0280
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0177
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0143
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0108
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0095
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0745

compara las combinaciones de grupos (niveles) de las dos variables de agrupamiento y.multcompareg1g2 En la matriz, el número 1 corresponde a la combinación de nivel de y nivel de, el número 2 corresponde a la combinación de nivel de y nivel de.results1g1hig22g1hig2 Del mismo modo, el número 3 corresponde a la combinación de nivel y nivel de, y el número 4 corresponde a la combinación de nivel de y nivel de.1g1log22g1log2 La última columna de la matriz contiene los valores-.p

Por ejemplo, la primera fila de la matriz muestra que la combinación de nivel y nivel de tiene los mismos valores de respuesta media que la combinación de nivel de y nivel de.1g1hig22g1hig2 El-valor correspondiente a esta prueba es 0,0280, que indica que las respuestas de la media son significativamente diferentes.p También puede ver este resultado en la figura. La barra azul muestra el intervalo de comparación para la respuesta media para la combinación de nivel y nivel de.1g1hig2 Las barras rojas son los intervalos de comparación para la respuesta media para otras combinaciones de grupos. Ninguna de las barras rojas se superponen con la barra azul, lo que significa que la respuesta media para la combinación de nivel y nivel de es significativamente diferente de la respuesta media para otras combinaciones de grupos.1g1hig2

Puede probar los otros grupos haciendo clic en el intervalo de comparación correspondiente para el grupo. La barra en la que haces clic se vuelve azul. Las barras para los grupos que son significativamente diferentes son de color rojo. Las barras para los grupos que no son significativamente diferentes son grises. Por ejemplo, si hace clic en el intervalo de comparación para la combinación de nivel de y nivel de, el intervalo de comparación para la combinación de nivel de y nivel de solapamientos, y por lo tanto es gris.1g1log22g1log2 Por el contrario, los otros intervalos de comparación son rojos, lo que indica una diferencia significativa.

Procedimientos de comparación múltiple

Para especificar el procedimiento de comparación múltiple que desea realizar, use el argumento de par nombre-valor. proporciona los siguientes procedimientos:multcompare'CType'multcompare

El procedimiento de diferencia honestamente significativa de Tukey

Puede especificar el procedimiento de diferencia honestamente significativo de Tukey mediante el argumento de par nombre-valor.'CType','Tukey-Kramer''CType','hsd' La prueba se basa en la distribución de rango estudentizado. RechazarH0:Αi = Αj Si

|t|=|y¯iy¯j|MSE(1ni+1nj)>12qα,k,Nk,

Dónde qα,k,Nk es el percentil superior 100 * (1 –) TH de la distribución de rango estudentizado con parámetro y – grados de libertad. es el número de grupos (tratamientos o medios marginales) y es el número total de observaciones.αkNkkN

El procedimiento de diferencia honestamente significativa de Tukey es óptimo para ANOVA de un solo sentido equilibrado y procedimientos similares con tamaños de muestra iguales. Se ha demostrado que es conservador para ANOVA de un solo sentido con diferentes tamaños de muestra. De acuerdo con la conjetura Tukey-Kramer no probada, también es precisa para los problemas donde las cantidades que se comparan están correlacionadas, como en el análisis de la covarianza con valores de covariable no balanceados.

El método Bonferroni

Puede especificar el método Bonferroni utilizando el par nombre-valor.'CType','bonferroni' Este método usa los valores críticos de Student-distribución después de un ajuste para compensar las comparaciones múltiples.t La prueba rechazaH0:Αi = Αj en el α/2(k2) nivel de significancia, donde está el número de grupos sik

|t|=|y¯iy¯j|MSE(1ni+1nj)>tα2(k2),Nk,

donde está el número total de observaciones y es el número de grupos (medios marginales).Nk Este procedimiento es conservador, pero generalmente menos que el procedimiento de Scheffé.

El enfoque de Dunn & Sidák

Puede especificar el enfoque de Dunn & Sidak mediante el argumento de par nombre-valor.'CType','dunn-sidak' Utiliza valores críticos de la distribución, después de un ajuste para múltiples comparaciones que fue propuesto por Dunn y demostró ser exacto por Sidák.t Esta prueba rechazaH0:Αi = Αj Si

|t|=|y¯iy¯j|MSE(1ni+1nj)>t1η/2,v,

Dónde

η=1(1α)1(k2)

y es el número de grupos.k Este procedimiento es similar, pero menos conservador que, el procedimiento de Bonferroni.

Diferencia menos significativa

Puede especificar el procedimiento de diferencia de menor importancia mediante el argumento de par nombre-valor.'CType','lsd' Esta prueba utiliza la estadística de prueba

t=y¯iy¯jMSE(1ni+1nj).

RechazaH0:Αi = Αj Si

|y¯iy¯j|>tα2,NkMSE(1ni+1nj)LSD.

Fisher sugiere una protección contra múltiples comparaciones mediante la realización de LSD sólo cuando la hipótesis nula H0:α1 =α2 = ... =αk es rechazada por el ANOVA-prueba.F Incluso en este caso, el LSD podría no rechazar ninguna de las hipótesis individuales. También es posible que ANOVA no rechace H0, incluso cuando hay diferencias entre algunos medios de grupo. Este comportamiento se produce porque la igualdad de los medios de grupo restantes puede hacer que la Estadística-test no sea significativa.F Sin ninguna condición, el LSD no proporciona ninguna protección contra el problema de comparación múltiple.

El procedimiento de Scheffe

Puede especificar el procedimiento de Scheffe mediante el argumento de par nombre-valor.'CType','scheffe' Los valores críticos se derivan de la distribución.F La prueba rechazaH0:Αi = Αj Si

|y¯iy¯j|MSE(1ni+1nj)>(k1)Fk1,Nk,α

Este procedimiento proporciona un nivel de confianza simultáneo para las comparaciones de todas las combinaciones lineales de los medios. Es conservador para comparaciones de simples diferencias de pares.

Referencias

[1] Milliken G. A. and D. E. Johnson. Analysis of Messy Data. Volume I: Designed Experiments. Boca Raton, FL: Chapman & Hall/CRC Press, 1992.

[2] Neter J., M. H. Kutner, C. J. Nachtsheim, W. Wasserman. 4th ed. Applied Linear Statistical Models.Irwin Press, 1996.

[3] Hochberg, Y., and A. C. Tamhane. Multiple Comparison Procedures. Hoboken, NJ: John Wiley & Sons, 1987.

Consulte también

| | | | | |

Temas relacionados