Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

anova1

Análisis unidireccional de la varianza

Descripción

ejemplo

p = anova1(y) realiza para los datos de ejemplo y devuelve el valor -. trata cada columna de como un grupo separado.ANOVA unidireccionalypanova1y La función prueba la hipótesis de que las muestras en las columnas de se extraen de poblaciones con la misma media contra la hipótesis alternativa que significa la población no son todas iguales.y La función también muestra la tabla ANOVA estándar y la de cada grupo ( ).caja de la parcelaytbl

p = anova1(y,group) realiza ANOVA unidireccional para los datos de muestra, agrupados por .ygroup

ejemplo

p = anova1(y,group,displayopt) habilita la tabla ANOVA y el trazado de cuadro se muestra cuando está (predeterminado) y suprime las pantallas cuando es .displayopt'on'displayopt'off'

ejemplo

[p,tbl] = anova1(___) devuelve la tabla ANOVA (incluidas las etiquetas de columna y fila) en la matriz de celdas mediante cualquiera de las combinaciones de argumentos de entrada de las sintaxis anteriores.tbl Para copiar una versión de texto de la tabla ANOVA en el portapapeles, seleccione en la figura de tabla ANOVA.Edit > Copy Text

ejemplo

[p,tbl,stats] = anova1(___) devuelve una estructura, , que puede utilizar para realizar un archivo .statsprueba de comparación múltiple Una prueba de comparación múltiple le permite determinar qué pares de medios de grupo son significativamente diferentes. Para realizar esta prueba, utilice , proporcionando la estructura como argumento de entrada.multcomparestats

Ejemplos

contraer todo

Cree una matriz de datos de muestra con columnas que sean constantes, además de perturbaciones normales aleatorias con media 0 y desviación estándar 1.y

y = meshgrid(1:5); rng default; % For reproducibility y = y + normrnd(0,1,5,5)
y = 5×5

    1.5377    0.6923    1.6501    3.7950    5.6715
    2.8339    1.5664    6.0349    3.8759    3.7925
   -1.2588    2.3426    3.7254    5.4897    5.7172
    1.8622    5.5784    2.9369    5.4090    6.6302
    1.3188    4.7694    3.7147    5.4172    5.4889

Realice ANOVA unidireccional.

p = anova1(y)

p = 0.0023 

La tabla ANOVA muestra la variación entre grupos ( ) y la variación dentro de los grupos ( ). es la suma de los cuadrados, y es los grados de libertad.ColumnsErrorSSdf El total de grados de libertad es el número total de observaciones menos una, que es 25 - 1 - 24. Los grados de libertad entre grupos es el número de grupos menos uno, que es 5 - 1 x 4. Los grados de libertad dentro de los grupos son grados totales de libertad menos los grados de libertad entre grupos, que es 24 - 4 x 20.

es el error cuadrado medio, que es para cada fuente de variación.MSSS/df La estadística es la relación de los errores al cuadrado medio (13.4309/2.2204).F El valor -es la probabilidad de que la estadística de prueba pueda tomar un valor mayor que el valor de la estadística de prueba calculada, es decir, P(F > 6.05).p El pequeño valor de 0.0023 indica que las diferencias entre las medias de columna son significativas.p

Introduzca los datos de muestra.

strength = [82 86 79 83 84 85 86 87 74 82 ...             78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',...          'al1','al1','al1','al1','al1','al1',...          'al2','al2','al2','al2','al2','al2'};

Los datos son de un estudio de la fuerza de las vigas estructurales en Hogg (1987). La resistencia vectorial mide las desviaciones de las vigas en milésimas de pulgada bajo 3000 libras de fuerza. La aleación vectorial identifica cada viga como acero ( ), aleación 1 ( ) o aleación 2 ( ).'st''al1''al2' Aunque la aleación se ordena en este ejemplo, no es necesario ordenar las variables de agrupación.

Pruebe la hipótesis nula de que las vigas de acero son iguales en resistencia a las vigas hechas de las dos aleaciones más caras. Desactive la visualización de la figura y devuelva los resultados de ANOVA en una matriz de celdas.

[p,tbl] = anova1(strength,alloy,'off')
p = 1.5264e-04 
tbl=4×6 cell
  Columns 1 through 5

    {'Source'}    {'SS'      }    {'df'}    {'MS'      }    {'F'       }
    {'Groups'}    {[184.8000]}    {[ 2]}    {[ 92.4000]}    {[ 15.4000]}
    {'Error' }    {[102.0000]}    {[17]}    {[  6.0000]}    {0x0 double}
    {'Total' }    {[286.8000]}    {[19]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[1.5264e-04]}
    {0x0 double  }
    {0x0 double  }

El grado total de libertad es el número total de observaciones menos una, que es

<math display="inline">
<mrow>
<mn>2</mn>
<mn>0</mn>
<mo>-</mo>
<mn>1</mn>
<mo>=</mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
</math>
. Los grados de libertad entre grupos es el número de grupos menos uno, que es
<math display="inline">
<mrow>
<mn>3</mn>
<mo>-</mo>
<mn>1</mn>
<mo>=</mo>
<mn>2</mn>
</mrow>
</math>
. Los grados de libertad dentro de los grupos son grados totales de libertad menos los grados de libertad entre grupos, que es
<math display="inline">
<mrow>
<mn>1</mn>
<mn>9</mn>
<mo>-</mo>
<mn>2</mn>
<mo>=</mo>
<mn>1</mn>
<mn>7</mn>
</mrow>
</math>
.

es el error cuadrado medio, que es para cada fuente de variación.MSSS/df La estadística -es la relación de los errores al cuadrado medio.F El valor -es la probabilidad de que la estadística de prueba pueda tomar un valor mayor o igual que el valor de la estadística de prueba.p El valor -valor de 1.5264e-04 sugiere el rechazo de la hipótesis nula.p

Puede recuperar los valores de la tabla ANOVA indexando en la matriz de celdas. Guarde el valor -statistic y el valor -en las nuevas variables y .FpFstatpvalue

Fstat = tbl{2,5}
Fstat = 15.4000 
pvalue = tbl{2,6}
pvalue = 1.5264e-04 

Introduzca los datos de muestra.

strength = [82 86 79 83 84 85 86 87 74 82 ...             78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',...          'al1','al1','al1','al1','al1','al1',...          'al2','al2','al2','al2','al2','al2'};

Los datos son de un estudio de la fuerza de las vigas estructurales en Hogg (1987). La resistencia vectorial mide las desviaciones de las vigas en milésimas de pulgada bajo 3000 libras de fuerza. La aleación vectorial identifica cada viga como acero ( ), aleación 1 ( ) o aleación 2 ( ).stal1al2 Aunque la aleación se ordena en este ejemplo, no es necesario ordenar las variables de agrupación.

Realice ANOVA unidireccional utilizando .anova1 Devolver la estructura, que contiene las estadísticas necesarios para realizar .statsmultcompareMultiple Comparisons

[~,~,stats] = anova1(strength,alloy);

El pequeño valor de 0.0002 sugiere que la fuerza de las vigas no es la misma.p

Realice una comparación múltiple de la intensidad media de las vigas.

[c,~,~,gnames] = multcompare(stats);

Visualice los resultados de la comparación con los nombres de grupo correspondientes.

[gnames(c(:,1)), gnames(c(:,2)), num2cell(c(:,3:6))]
ans=3×6 cell
  Columns 1 through 5

    {'st' }    {'al1'}    {[ 3.6064]}    {[ 7]}    {[10.3936]}
    {'st' }    {'al2'}    {[ 1.6064]}    {[ 5]}    {[ 8.3936]}
    {'al1'}    {'al2'}    {[-5.6280]}    {[-2]}    {[ 1.6280]}

  Column 6

    {[1.6831e-04]}
    {[    0.0040]}
    {[    0.3560]}

Las dos primeras columnas muestran el par de grupos que se comparan. La cuarta columna muestra la diferencia entre las medias de grupo estimadas. La tercera y quinta columnas muestran los límites inferior y superior para los intervalos de confianza del 95% de la verdadera diferencia de medios. La sexta columna muestra el valor -value para una hipótesis de que la verdadera diferencia de medios para los grupos correspondientes es igual a cero.p

Las dos primeras filas muestran que ambas comparaciones que implican el primer grupo (acero) tienen intervalos de confianza que no incluyen cero. Dado que los valores correspondientes (1.6831e-04 y 0.0040, respectivamente) son pequeños, esas diferencias son significativas.p

La tercera fila muestra que las diferencias de resistencia entre las dos aleaciones no son significativas. Un intervalo de confianza del 95% para la diferencia es [-5.6,1.6], por lo que no puede rechazar la hipótesis de que la diferencia verdadera es cero. El valor -valor correspondiente de 0.3560 en la sexta columna confirma este resultado.p

En la figura, la barra azul representa el intervalo de comparación de la resistencia media del material para el acero. Las barras rojas representan los intervalos de comparación para la resistencia media del material para la aleación 1 y la aleación 2. Ninguna de las barras rojas se superpone con la barra azul, lo que indica que la resistencia media del material para el acero es significativamente diferente de la de la aleación 1 y la aleación 2. Para confirmar la diferencia significativa haciendo clic en las barras que representan la aleación 1 y 2.

Argumentos de entrada

contraer todo

Datos de muestra, especificados como vector o matriz.

  • Si es un vector, debe especificar el argumento de entrada.ygroup Cada elemento de representa un nombre de grupo del elemento correspondiente en .groupy La función trata los valores correspondientes al mismo valor como parte del mismo grupo.anova1ygroup Utilice este diseño cuando los grupos tengan diferentes números de elementos (ANOVA desequilibrado).

  • Si es una matriz y no especifica , a continuación, trata cada columna de como un grupo independiente.ygroupanova1y En este diseño, la función evalúa si las medias de población de las columnas son iguales. Utilice este diseño cuando cada grupo tenga el mismo número de elementos (ANOVA equilibrado).

  • Si es una matriz y especifica , cada elemento de representa un nombre de grupo para la columna correspondiente en .ygroupgroupy La función trata las columnas que tienen el mismo nombre de grupo como parte del mismo grupo.anova1

Nota

ignora cualquier valor de .anova1NaNy Además, si contiene valores vacíos o, ignora las observaciones correspondientes en .groupNaNanova1y La función realiza ANOVA equilibrado si cada grupo tiene el mismo número de observaciones después de que la función no tenga vacío o valores.anova1NaN De lo contrario, realiza ANOVA desequilibrado.anova1

Tipos de datos: single | double

Variable de agrupación que contiene nombres de grupo, especificada como vector numérico, vector lógico, vector categórico, matriz de caracteres, matriz de cadenas o matriz de celdas de vectores de caracteres.

  • Si es un vector, cada elemento de representa un nombre de grupo del elemento correspondiente en .ygroupy La función trata los valores correspondientes al mismo valor como parte del mismo grupo.anova1ygroup

    es el número total de observaciones.N

  • Si es una matriz, cada elemento de representa un nombre de grupo para la columna correspondiente en .ygroupy La función trata las columnas que tienen el mismo nombre de grupo como parte del mismo grupo.anova1y

    Si no desea especificar nombres de grupo para los datos de ejemplo de matriz, escriba una matriz vacía ( ) u omita este argumento.y[] En este caso, trata cada columna como un grupo independiente.anova1y

Si contiene valores vacíos o, ignora las observaciones correspondientes en .groupNaNanova1y

Para obtener más información sobre la agrupación de variables, consulte .Grouping Variables

Ejemplo: cuando es un vector con observaciones categorizadas en los grupos 1, 2 y 3'group',[1,2,1,3,1,...,3,1]y

Ejemplo: cuando es una matriz con cinco columnas categorizadas en grupos rojo, blanco y negro'group',{'white','red','white','black','red'}y

Tipos de datos: single | double | logical | categorical | char | string | cell

Indicador para mostrar la tabla ANOVA y el trazado de cuadro, especificados como o .'on''off' Cuando es , devuelve los argumentos de salida, solo.displayopt'off'anova1 No muestra la tabla ANOVA estándar y el trazado de caja.

Ejemplo: p = anova(x,group,'off')

Argumentos de salida

contraer todo

-value para el -test, devuelto como un valor escalar. -value es la probabilidad de que -statistic pueda tomar un valor mayor que el valor calculado de la estadística de prueba. prueba la hipótesis nula de que todos los medios de grupo son iguales entre sí contra la hipótesis alternativa de que al menos una media de grupo es diferente de las demás.pFpFanova1 La función deriva el valor -value del cdf de la -distribution.pF

Un valor que es menor que el nivel de significancia indica que al menos uno de los medios de la muestra es significativamente diferente de los demás.p Los niveles de significancia comunes son 0.05 o 0.01.

Tabla ANOVA, devuelta como una matriz de celdas. tiene seis columnas.tbl

ColumnaDefinición
sourceLa fuente de la variabilidad.
SSLa suma de cuadrados debido a cada fuente.
dfLos grados de libertad asociados a cada fuente. Supongamos que es el número total de observaciones y es el número de grupos.Nk Entonces, – es el grado de libertad dentro de los grupos ( ), – 1 es el grado de libertad entre grupos ( ), y – 1 es el grado total de libertad. – 1o ( – ) + ( – 1)NkErrorkColumnsNNNkk
MSLos cuadrados medios para cada fuente, que es la relación .SS/df
F-estadística, que es la relación de los cuadrados medios.F
Prob>FEl valor -value, que es la probabilidad de que -statistic pueda tomar un valor mayor que el valor calculado de la estadística de prueba. deriva esta probabilidad del cdf de -distribution.pFanova1F

Las filas de la tabla ANOVA muestran la variabilidad en los datos divididos por el origen.

FilaDefinición
GroupsVariabilidad debida a las diferencias entre los medios del grupo (grupos de variabilidad)Entre
ErrorVariabilidad debida a las diferencias entre los datos de cada grupo y la media del grupo (grupos de variabilidad)Dentro
TotalVariabilidad total

Estadísticas para , devuelto como una estructura con los campos descritos en esta tabla.múltiples pruebas de comparación

Nombre del campoDefinición
gnamesNombres de los grupos
nNúmero de observaciones en cada grupo
sourceFuente de la salidastats
meansValores estimados de los medios
dfError (dentro de los grupos) grados de libertad ( – , donde está el número total de observaciones y es el número de grupos)NkNk
sRaíz cuadrada del error cuadrado medio

Más acerca de

contraer todo

Caja gráfica

devuelve una gráfica de caja de las observaciones para cada grupo en .anova1y Los diagramas de cuadro proporcionan una comparación visual de los parámetros de ubicación del grupo.

En cada caja, la marca central es la mediana (2o cuantil,q2) y los bordes de la caja son los percentiles 25 y 75 (1o y 3o cuantiles,q1 Yq3, respectivamente). Los bigotes se extienden a los puntos de datos más extremos que no se consideran valores atípicos. Los valores atípicos se trazan individualmente utilizando el símbolo.'+' Los extremos de los bigotes corresponden a q3 + 1.5 × (q3q1) Y q1 – 1.5 × (q3q1).

Las gráficas de cuadro incluyen muescas para la comparación de los valores medianos. Dos medianas son significativamente diferentes en el nivel de significancia del 5% si sus intervalos, representados por muescas, no se superponen. Esta prueba es diferente de la -prueba que realiza ANOVA; sin embargo, grandes diferencias en las líneas centrales de los cuadros corresponden a un valor estadístico grande y, en consecuencia, a un pequeño valor.FFp Los extremos de las muescas corresponden aq2 – 1.57(q3q1)/sqrt( ) ynq2 + 1,57(q3q1)/sqrt( ), donde está el número de observaciones sin valores.nnNaN

Para obtener más información acerca de las gráficas de cuadro, consulte y de .'Whisker''Notch'boxplot

Referencias

[1] Hogg, R. V., and J. Ledolter. Engineering Statistics. New York: MacMillan, 1987.

Introducido antes de R2006a