Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

multcompare

Prueba de comparación múltiple

Descripción

ejemplo

c = multcompare(stats) Devuelve una matriz de los resultados de la comparación por pares de una prueba de comparación múltiple utilizando la información contenida en la estructura. también muestra un gráfico interactivo de las estimaciones y los intervalos de comparación.cstatsmultcompare Cada medio de grupo se representa mediante un símbolo y el intervalo se representa mediante una línea que se extiende desde el símbolo. Dos medios de grupo son significativamente diferentes si sus intervalos son disjuntas; no son significativamente diferentes si sus intervalos se superponen. Si usa el mouse para seleccionar cualquier grupo, el gráfico resaltará todos los demás grupos que sean significativamente diferentes, si los hay.

ejemplo

c = multcompare(stats,Name,Value) Devuelve una matriz de resultados de comparación en pares, utilizando opciones adicionales especificadas por uno o más argumentos de par.cName,Value Por ejemplo, puede especificar el intervalo de confianza o el tipo de valor crítico que se usará en la comparación múltiple.

[c,m] = multcompare(___) también devuelve una matriz, que contiene los valores estimados de los medios (o las estadísticas que se comparan) para cada grupo y los errores estándar correspondientes.m Puede utilizar cualquiera de las sintaxis anteriores.

[c,m,h] = multcompare(___) también devuelve un identificador, al gráfico de comparación.h

ejemplo

[c,m,h,gnames] = multcompare(___) también devuelve una matriz de celdas, que contiene los nombres de los grupos.gnames

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carsmall

Realizar un análisis unidireccional de la varianza (ANOVA) para ver si hay alguna diferencia entre el kilometraje de los coches por origen.

[p,t,stats] = anova1(MPG,Origin,'off');

Realice una comparación múltiple de los medios del grupo.

[c,m,h,nms] = multcompare(stats);

muestra las estimaciones con intervalos de comparación a su alrededor.multcompare Puede hacer clic en las gráficas de cada país para comparar su media con la de otros países.

Ahora visualice las estimaciones de media y los errores estándar con los nombres de grupo correspondientes.

[nms num2cell(m)]
ans = 6x3 cell array
    {'USA'    }    {[21.1328]}    {[0.8814]}
    {'Japan'  }    {[31.8000]}    {[1.8206]}
    {'Germany'}    {[28.4444]}    {[2.3504]}
    {'France' }    {[23.6667]}    {[4.0711]}
    {'Sweden' }    {[22.5000]}    {[4.9860]}
    {'Italy'  }    {[     28]}    {[7.0513]}

Cargue los datos de ejemplo.

load popcorn popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Los datos provienen de un estudio de marcas de palomitas de maíz y tipos de Popper (Hogg 1987). Las columnas de la matriz son marcas (gourmet, nacional y genérica).popcorn Las hileras son de tipo Popper aceite y aire. En el estudio, los investigadores reventaron un lote de cada marca tres veces con cada Popper. Los valores son el rendimiento en tazas de palomitas de maíz reventado.

Realice un ANOVA de dos vías. Calcule también las estadísticas que necesita para realizar una prueba de comparación múltiple en los efectos principales.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

La estructura incluyestats

  • El error medio cuadrado ()sigmasq

  • Las estimaciones del rendimiento medio para cada marca de palomitas de maíz ()colmeans

  • El número de observaciones para cada marca de palomitas de maíz ()coln

  • La estimación del rendimiento medio para cada tipo de Popper ()rowmeans

  • El número de observaciones para cada tipo de Popper ()rown

  • El número de interacciones ()inter

  • El-valor que muestra el nivel de significancia del término de interacción ()ppval

  • Los grados de error de libertad ().df

Realice una prueba de comparación múltiple para ver si el rendimiento de las palomitas de maíz difiere entre pares de marcas de palomitas de maíz (columnas).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be  difficult to interpret when the model includes interactions. 

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Las dos primeras columnas de mostrar los grupos que se comparan.c La cuarta columna muestra la diferencia entre el medio de grupo estimado. Las columnas tercera y quinta muestran los límites inferior y superior de los intervalos de confianza del 95% para la diferencia media real. La sexta columna contiene el-valor de una prueba de hipótesis de que la diferencia media correspondiente es igual a cero.p Todos los valores (0, 0 y 0,0116) son muy pequeños, lo que indica que el rendimiento de las palomitas de maíz difiere en las tres marcas.p

La figura muestra la comparación múltiple de los medios. De forma predeterminada, la media del grupo 1 se resalta y el intervalo de comparación está en azul. Debido a que los intervalos de comparación para los otros dos grupos no se cruzan con los intervalos para el grupo 1 significan, se resaltan en rojo. Esta falta de intersección indica que ambos medios son diferentes de la media del grupo 1. Seleccione otros medios de grupo para confirmar que todos los medios de grupo son significativamente diferentes entre sí.

Realice una prueba de comparación múltiple para ver el rendimiento de las palomitas de maíz difiere entre los dos tipos de Popper (filas).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be  difficult to interpret when the model includes interactions. 

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

El pequeño valor de 0,0001 indica que el rendimiento de las palomitas de maíz difiere entre los dos tipos de Popper (aire y aceite).p La figura muestra los mismos resultados. Los intervalos de comparación disjuntas indican que los medios del grupo son significativamente diferentes entre sí.

Cargue los datos de ejemplo.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]'; g1 = [1 2 1 2 1 2 1 2]; g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

es el vector de respuesta y, y son las variables de agrupamiento (factores).yg1g2g3 Cada factor tiene dos niveles, y cada observación en se identifica por una combinación de niveles de factores.y Por ejemplo, la observación está asociada con el nivel 1 del factor, el nivel de factor y el nivel de factor.y(1)g1'hi'g2'may'g3 Del mismo modo, la observación se asocia con el nivel 2 del factor, el nivel de factor y el nivel de factor.y(6)g1'hi'g2'june'g3

Pruebe si la respuesta es la misma para todos los niveles de factor. Calcule también las estadísticas necesarias para varias pruebas de comparación.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...     'varnames',{'g1','g2','g3'});

El-valor de 0,2578 indica que las respuestas medias de los niveles y del factor no son significativamente diferentes.p'may''june'g3 El-valor de 0,0347 indica que las respuestas medias de los niveles y del factor son significativamente diferentes.p12g1 Del mismo modo, el-valor de 0,0048 indica que las respuestas medias para los niveles y de factor son significativamente diferentes.p'hi''lo'g2

Realizar varias pruebas de comparación para averiguar qué grupos de los factores y son significativamente diferentes.g1g2

results = multcompare(stats,'Dimension',[1 2])

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0280
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0177
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0143
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0108
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0095
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0745

compara las combinaciones de grupos (niveles) de las dos variables de agrupamiento y.multcompareg1g2 En la matriz, el número 1 corresponde a la combinación de nivel de y nivel de, el número 2 corresponde a la combinación de nivel de y nivel de.results1g1hig22g1hig2 Del mismo modo, el número 3 corresponde a la combinación de nivel y nivel de, y el número 4 corresponde a la combinación de nivel de y nivel de.1g1log22g1log2 La última columna de la matriz contiene los valores-.p

Por ejemplo, la primera fila de la matriz muestra que la combinación de nivel y nivel de tiene los mismos valores de respuesta media que la combinación de nivel de y nivel de.1g1hig22g1hig2 El-valor correspondiente a esta prueba es 0,0280, que indica que las respuestas de la media son significativamente diferentes.p También puede ver este resultado en la figura. La barra azul muestra el intervalo de comparación para la respuesta media para la combinación de nivel y nivel de.1g1hig2 Las barras rojas son los intervalos de comparación para la respuesta media para otras combinaciones de grupos. Ninguna de las barras rojas se superponen con la barra azul, lo que significa que la respuesta media para la combinación de nivel y nivel de es significativamente diferente de la respuesta media para otras combinaciones de grupos.1g1hig2

Puede probar los otros grupos haciendo clic en el intervalo de comparación correspondiente para el grupo. La barra en la que haces clic se vuelve azul. Las barras para los grupos que son significativamente diferentes son de color rojo. Las barras para los grupos que no son significativamente diferentes son grises. Por ejemplo, si hace clic en el intervalo de comparación para la combinación de nivel de y nivel de, el intervalo de comparación para la combinación de nivel de y nivel de solapamientos, y por lo tanto es gris.1g1log22g1log2 Por el contrario, los otros intervalos de comparación son rojos, lo que indica una diferencia significativa.

Argumentos de entrada

contraer todo

Datos de prueba, especificados como una estructura. Puede crear una estructura utilizando una de las siguientes funciones:

  • — Análisis unidireccional de la varianza.anova1

  • — Análisis bidireccional de la varianza.anova2

  • — Análisis de la varianza de la forma.anovanN

  • — Análisis interactivo de la herramienta de covarianza.aoctool

  • — La prueba de Friedman.friedman

  • — Prueba de Kruskal-Wallis.kruskalwallis

no admite comparaciones múltiples mediante la salida de un modelo que incluye efectos aleatorios o anidados.multcompareanovan Los cálculos para un modelo de efectos aleatorios producen una advertencia de que todos los efectos se tratan como fijos. No se aceptan modelos anidados.

Tipos de datos: struct

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: computa los valores críticos de Bonferroni, realiza las pruebas de hipótesis en el nivel de significancia del 1% y omite la visualización interactiva.'Alpha',0.01,'CType','bonferroni','Display','off'

Nivel de significancia de la prueba de comparación múltiple, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).'Alpha' El valor especificado para determina el'Alpha' 100 × (1 – α) niveles de confianza de los intervalos devueltos en la matriz y en la figura.c

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de valor crítico que se usará para la comparación múltiple, especificado como el par separado por comas que consta de y uno de los siguientes.'CType'

Ejemplo: 'CType','bonferroni'

Alternar pantalla, especificado como el par separado por comas que consta de y cualquiera o.'Display''on''off' Si se especifica, se muestra un gráfico de las estimaciones y sus intervalos de comparación.'on'multcompare Si se especifica, se omite el gráfico.'off'multcompare

Ejemplo: 'Display','off'

Vector que especifica la cota o las cotas sobre las que se calcula el medio marginal de población, especificado como un valor entero positivo, o un vector de dichos valores. Utilice el par nombre-valor sólo si crea la estructura de entrada utilizando la función.'Dimension'statsanovan

Por ejemplo, si especifica como, a continuación, compara los medios para cada valor de la primera variable de agrupamiento, ajustado eliminando los efectos de las otras variables de agrupamiento como si el diseño estuviera equilibrado.'Dimension'1multcompare Si especifica como, a continuación, calcula la población significa marginal para cada combinación de la primera y tercera variables de agrupamiento, eliminando los efectos de la segunda variable de agrupamiento.'Dimension'[1,3]multcompare Si se ajusta a un modelo singular, algunos medios celulares pueden no ser estimable y cualquier población marginal significa que dependen de esos medios celulares tendrán el valor.NaN

Los medios marginales de la población son descritos por Milliken y Johnson (1992) y por Searle, Speed y Milliken (1980). La idea detrás de la población significa marginal es eliminar cualquier efecto de un diseño desequilibrado mediante la fijación de los valores de los factores especificados por, y el promedio de los efectos de otros factores como si cada combinación de factor se produjo el mismo número de veces.'Dimension' La definición de medios marginales de población no depende del número de observaciones en cada combinación de factores. Para experimentos diseñados donde el número de observaciones en cada combinación de factores no tiene significado, los medios marginales de la población pueden ser más fáciles de interpretar que los medios simples ignorando otros factores. Para las encuestas y otros estudios en los que el número de observaciones en cada combinación tiene sentido, la población significa que puede ser más difícil de interpretar.

Ejemplo: 'Dimension',[1,3]

Tipos de datos: single | double

Estimaciones que se comparan, especificadas como el par separado por comas que consta de y un valor permitido.'Estimate' Los valores permitidos dependen de la función utilizada para generar la estructura de entrada, según la tabla siguiente.'Estimate'stats

FuenteValores
anova1

Ninguno. Este par nombre-valor se omite y siempre compara los medios del grupo.multcompare

anova2

Ya sea para comparar medias de columna, o para comparar medias de fila.'column''row'

anovan

Ninguno. Este par nombre-valor se omite y siempre compara los medios marginales de la población según lo especificado por el argumento de par nombre-valor.multcompare'Dimension'

aoctool

Ya sea, o para comparar las pendientes, Interceptas o medias marginales de la población, respectivamente.'slope''intercept''pmm' Si el análisis del modelo de covarianza no incluye pendientes separadas, entonces no se permite.'slope' Si no incluye Interceptas separadas, entonces no es posible hacer comparaciones.

friedman

Ninguno. Este par nombre-valor se omite y siempre compara los rangos de columna promedio.multcompare

kruskalwallis

Ninguno. Este par nombre-valor se omite y siempre compara los rangos de grupo promedio.multcompare

Ejemplo: 'Estimate','row'

Argumentos de salida

contraer todo

Matriz de resultados de comparación múltiple, devuelta como una matriz de valores escalares de-por-6, donde es el número de pares de grupos.pp Cada fila de la matriz contiene el resultado de una prueba de comparación emparejada. Las columnas 1 y 2 contienen los índices de las dos muestras que se comparan. La columna 3 contiene el intervalo de confianza más bajo, la columna 4 contiene la estimación y la columna 5 contiene el intervalo de confianza superior. La columna 6 contiene el-valor para la prueba de hipótesis de que la diferencia media correspondiente no es igual a 0.p

Por ejemplo, supongamos que una fila contiene las siguientes entradas.

2.0000  5.0000  1.9442  8.2206  14.4971 0.0432

Estos números indican que la media del grupo 2 menos la media del Grupo 5 se estima en 8,2206, y un intervalo de confianza del 95% para la verdadera diferencia de los medios es [1,9442, 14,4971]. El-valor para la prueba de hipótesis correspondiente que la diferencia de los medios de los grupos 2 y 5 es significativamente diferente de cero es 0,0432.p

En este ejemplo, el intervalo de confianza no contiene 0, por lo que la diferencia es significativa en el nivel de significancia del 5%. Si el intervalo de confianza contenía 0, la diferencia no sería significativa. El-valor de 0,0432 también indica que la diferencia de los medios de los grupos 2 y 5 es significativamente diferente de 0.p

Matriz de las estimaciones, devuelta como una matriz de valores escalares. La primera columna contiene los valores estimados de los medios (o las estadísticas que se comparan) para cada grupo, y la segunda columna contiene sus errores estándar.m

Identificador de la figura que contiene el gráfico interactivo, devuelto como un identificador. El título de este gráfico contiene instrucciones para interactuar con el gráfico y la etiqueta del eje contiene información sobre qué medios son significativamente diferentes de la media seleccionada.x Si planea utilizar este gráfico para la presentación, es posible que desee omitir el título y la etiqueta del eje.x Puede eliminarlos utilizando las funciones interactivas de la ventana del gráfico, o puede utilizar los siguientes comandos.

title('') xlabel('')

Nombres de grupo, devueltos como una matriz de vectores de caracteres de celda. Cada fila de contiene el nombre de un grupo.gnames

Más acerca de

contraer todo

Varias pruebas de comparación

El análisis de varianza compara los medios de varios grupos para probar la hipótesis de que todos son iguales, contra la alternativa general de que no todos son iguales. A veces esta alternativa puede ser demasiado general. Es posible que necesite información sobre qué pares de medios son significativamente diferentes y cuáles no. A puede proporcionar esta información.multiple comparison test

Cuando se realiza una prueba simple de una media de grupo contra otra, se especifica un nivel de significancia que determina el valor límite de la-estadística.tt Por ejemplo, puede especificar el valor = para asegurarse de que cuando no hay ninguna diferencia real, se encuentra incorrectamente una diferencia significativa no más del 5% del tiempo.alpha0,05 Cuando hay muchos medios de grupo, también hay muchos pares para comparar. Si aplicó una prueba ordinaria en esta situación, el valor se aplicaría a cada comparación, por lo que la probabilidad de encontrar incorrectamente una diferencia significativa aumentaría con el número de comparaciones.talpha Los procedimientos de comparación múltiples están diseñados para proporcionar un límite superior a la probabilidad de que la comparación se encuentra incorrectamente significativa.any

Referencias

[1] Hochberg, Y., and A. C. Tamhane. Multiple Comparison Procedures. Hoboken, NJ: John Wiley & Sons, 1987.

[2] Milliken, G. A., and D. E. Johnson. Analysis of Messy Data, Volume I: Designed Experiments. Boca Raton, FL: Chapman & Hall/CRC Press, 1992.

[3] Searle, S. R., F. M. Speed, and G. A. Milliken. “Population marginal means in the linear model: an alternative to least-squares means.” American Statistician. 1980, pp. 216–221.

Consulte también

| | | | |

Introducido antes de R2006a