Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

anova1

Un análisis unidireccional de la varianza

Descripción

ejemplo

p = anova1(y) Devuelve el valor-Value para un equilibrado.pANOVA de un solo sentido También muestra la tabla ANOVA estándar () y una gráfica de caja de las columnas de. pone a prueba la hipótesis de que las muestras se dibujan de poblaciones con la misma media contra la hipótesis alternativa de que los medios de población no son todos iguales.tblyanova1y

p = anova1(y,group) Devuelve el valor-Value para un ANOVA de un solo sentido equilibrado por grupo.p También muestra la tabla ANOVA estándar y una de las observaciones del grupo.Box-Ploty

ejemplo

p = anova1(y,group,displayopt) permite que la tabla ANOVA y el diagrama de caja se muestran cuando es (predeterminado) y suprime las visualizaciones cuando es.displayopt'on'displayopt'off'

ejemplo

[p,tbl] = anova1(___) Devuelve la tabla ANOVA (incluidas las etiquetas de columna y fila) en la matriz de celdas.tbl Para copiar una versión de texto de la tabla ANOVA en el portapapeles, seleccione.Edit > Copy Text

ejemplo

[p,tbl,stats] = anova1(___) Devuelve una estructura, que puede usar para realizar una.statsprueba de comparación múltiple Una prueba de comparación múltiple le permite determinar qué pares de medios de grupo son significativamente diferentes. Para realizar esta prueba, utilice, proporcionando la estructura como un argumento de entrada.multcomparestats

Ejemplos

contraer todo

Cree una matriz de datos de muestra con columnas que sean constantes, además de perturbaciones normales aleatorias con la media 0 y la desviación estándar 1.y

y = meshgrid(1:5); rng default; % For reproducibility y = y + normrnd(0,1,5,5)
y = 5×5

    1.5377    0.6923    1.6501    3.7950    5.6715
    2.8339    1.5664    6.0349    3.8759    3.7925
   -1.2588    2.3426    3.7254    5.4897    5.7172
    1.8622    5.5784    2.9369    5.4090    6.6302
    1.3188    4.7694    3.7147    5.4172    5.4889

Realizar ANOVA de un solo sentido.

p = anova1(y)

p = 0.0023 

La tabla ANOVA muestra la variación entre grupos () y la variación dentro de los grupos (). es la suma de los cuadrados, y es los grados de libertad.ColumnsErrorSSdf El total de grados de libertad es el número total de observaciones menos uno, que es 25-1 = 24. Los grados de libertad entre grupos es el número de grupos menos uno, que es 5-1 = 4. Los grados de libertad dentro de los grupos son los grados de libertad totales menos el entre los grados de libertad de los grupos, que es 24-4 = 20.

es el error cuadrado medio, que es para cada fuente de variación.MSSS/df La-estadística es la relación de los errores cuadráticos medio (13.4309/2.2204).F El-valor es la probabilidad de que la estadística de prueba puede tomar un valor mayor que el valor de la estadística de prueba calculada, es decir, P (F > 6,05).p El valor pequeño de 0,0023 indica que las diferencias entre las medias de columna son significativas.p

Introduzca los datos de muestra.

strength = [82 86 79 83 84 85 86 87 74 82 ...             78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',...          'al1','al1','al1','al1','al1','al1',...          'al2','al2','al2','al2','al2','al2'};

Los datos provienen de un estudio de la fuerza de las vigas estructurales en Hogg (1987). La fuerza vectorial mide las depresiones de las vigas en milésimas de pulgada por debajo de 3000 libras de fuerza. La aleación vectorial identifica cada viga como acero (), aleación 1 () o aleación 2 ().'st''al1''al2' Aunque la aleación se ordena en este ejemplo, las variables de agrupamiento no necesitan ser ordenadas.

Pruebe la hipótesis nula de que las vigas de acero son iguales en fuerza a las vigas hechas de las dos aleaciones más costosas. Desactive la visualización de la figura y devuelva los resultados del ANOVA en una matriz de celdas.

[p,tbl] = anova1(strength,alloy,'off')
p = 1.5264e-04 
tbl = 4x6 cell array
  Columns 1 through 5

    {'Source'}    {'SS'      }    {'df'}    {'MS'      }    {'F'       }
    {'Groups'}    {[184.8000]}    {[ 2]}    {[ 92.4000]}    {[ 15.4000]}
    {'Error' }    {[102.0000]}    {[17]}    {[  6.0000]}    {0x0 double}
    {'Total' }    {[286.8000]}    {[19]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[1.5264e-04]}
    {0x0 double  }
    {0x0 double  }

El total de grados de libertad es el número total de observaciones menos uno, que es

<math display="inline">
<mrow>
<mn>2</mn>
<mn>0</mn>
<mo>-</mo>
<mn>1</mn>
<mo>=</mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
</math>
. Los grados de libertad entre grupos es el número de grupos menos uno, que es
<math display="inline">
<mrow>
<mn>3</mn>
<mo>-</mo>
<mn>1</mn>
<mo>=</mo>
<mn>2</mn>
</mrow>
</math>
. Los grados de libertad dentro de los grupos son los grados de libertad totales menos el entre los grados de libertad de los grupos, que es
<math display="inline">
<mrow>
<mn>1</mn>
<mn>9</mn>
<mo>-</mo>
<mn>2</mn>
<mo>=</mo>
<mn>1</mn>
<mn>7</mn>
</mrow>
</math>
.

es el error cuadrado medio, que es para cada fuente de variación.MSSS/df La-estadística es la relación de los errores cuadráticos medio.F El-valor es la probabilidad de que la estadística de prueba puede tomar un valor mayor o igual que el valor de la estadística de prueba.p El-valor de 1.5264 e-04 sugiere el rechazo de la hipótesis nula.p

Puede recuperar los valores de la tabla ANOVA indexando en la matriz de celdas. Salve el valor-estadístico y el-valor en las nuevas variables y.FpFstatpvalue

Fstat = tbl{2,5}
Fstat = 15.4000 
pvalue = tbl{2,6}
pvalue = 1.5264e-04 

Introduzca los datos de muestra.

strength = [82 86 79 83 84 85 86 87 74 82 ...             78 75 76 77 79 79 77 78 82 79]; alloy = {'st','st','st','st','st','st','st','st',...          'al1','al1','al1','al1','al1','al1',...          'al2','al2','al2','al2','al2','al2'};

Los datos provienen de un estudio de la fuerza de las vigas estructurales en Hogg (1987). La fuerza vectorial mide las depresiones de las vigas en milésimas de pulgada por debajo de 3000 libras de fuerza. La aleación vectorial identifica cada viga como acero (), aleación 1 () o aleación 2 ().stal1al2 Aunque la aleación se ordena en este ejemplo, las variables de agrupamiento no necesitan ser ordenadas.

Realizar ANOVA de un solo sentido utilizando.anova1 Devuelva la estructura, que contiene las necesidades de estadísticas para realizar.statsmultcompareComparaciones múltiples

[~,~,stats] = anova1(strength,alloy);

El pequeño valor de 0,0002 sugiere que la fuerza de las vigas no es la misma.p

Realice una comparación múltiple de la fuerza media de las vigas.

[c,~,~,gnames] = multcompare(stats);

Visualice los resultados de la comparación con los nombres de grupo correspondientes.

[gnames(c(:,1)), gnames(c(:,2)), num2cell(c(:,3:6))]
ans = 3x6 cell array
  Columns 1 through 5

    {'st' }    {'al1'}    {[ 3.6064]}    {[ 7]}    {[10.3936]}
    {'st' }    {'al2'}    {[ 1.6064]}    {[ 5]}    {[ 8.3936]}
    {'al1'}    {'al2'}    {[-5.6280]}    {[-2]}    {[ 1.6280]}

  Column 6

    {[1.6831e-04]}
    {[    0.0040]}
    {[    0.3560]}

Las dos primeras columnas muestran el par de grupos que se comparan. La cuarta columna muestra la diferencia entre el medio de grupo estimado. Las columnas tercera y quinta muestran los límites inferior y superior para los intervalos de confianza del 95% de la verdadera diferencia de medias. La sexta columna muestra el-valor de una hipótesis de que la verdadera diferencia de medias para los grupos correspondientes es igual a cero.p

Las dos primeras filas muestran que ambas comparaciones que implican el primer grupo (acero) tienen intervalos de confianza que no incluyen cero. Debido a que los valores correspondientes (1.6831 e-04 y 0,0040, respectivamente) son pequeños, esas diferencias son significativas.p

La tercera fila muestra que las diferencias de fuerza entre las dos aleaciones no son significativas. Un intervalo de confianza de 95% para la diferencia es [-5.6, 1.6], por lo que no se puede rechazar la hipótesis de que la diferencia verdadera es cero. El valor correspondiente de 0,3560 en la sexta columna confirma este resultado.p

En la figura, la barra azul representa el intervalo de comparación para la fuerza media del material para el acero. Las barras rojas representan los intervalos de comparación para la fuerza media del material para la aleación 1 y la aleación 2. Ninguna de las barras rojas se superponen con la barra azul, lo que indica que la fuerza media del material para el acero es significativamente diferente de la de la aleación 1 y la aleación 2. Para confirmar la diferencia significativa haciendo clic en las barras que representan la aleación 1 y 2.

Argumentos de entrada

contraer todo

Datos de ejemplo, especificados como un vector o una matriz.

  • Si es un vector, debe especificar el argumento de entrada. debe ser una variable categórica, un vector numérico, un vector lógico, una matriz de caracteres, una matriz de cadenas o una matriz de vectores de caracteres, con un nombre para cada elemento de.ygroupgroupy La función trata los valores correspondientes al mismo valor de como parte del mismo grupo.anova1ygroup Utilice este diseño cuando los grupos tengan diferentes números de elementos (ANOVA no balanceado).

  • Si es una matriz y no se especifica, trata cada columna como un grupo independiente.ygroupanova1y En este diseño, la función evalúa si los medios de población de las columnas son iguales. Utilice este diseño cuando cada grupo tenga el mismo número de elementos (ANOVA equilibrado).

  • Si es una matriz y especifica, debe ser una matriz de caracteres, matriz de cadenas o matriz de celdas de vectores de caracteres, con un nombre para cada columna de.ygroupgroupy La función trata las columnas que tienen el mismo nombre de grupo como parte del mismo grupo.anova1

Si contiene elementos vacíos o con valores, ignora las observaciones correspondientes.groupNaNanova1y

Tipos de datos: single | double

Variable de agrupación, especificada como vector numérico o lógico, matriz de caracteres, matriz de cadenas o matriz de celdas de vectores de caracteres, que contiene nombres de grupo.

  • Si es un vector, debe ser una variable categórica, Vector numérico, Vector lógico, matriz de caracteres, matriz de cadenas o matriz de celdas de vectores de caracteres, con un nombre para cada elemento de.ygroupy La función trata los valores correspondientes al mismo valor de como parte del mismo grupo.anova1ygroup

    es el número total de observaciones.N

  • Si es una matriz, debe ser una matriz de caracteres, una matriz de cadenas o una matriz de vectores de caracteres, con un nombre de grupo para cada columna de.ygroupy La función trata las columnas de que tienen el mismo nombre de grupo como parte del mismo grupo.anova1y

    Si no desea especificar nombres de grupo, escriba una matriz vacía () u omita este argumento.[]

Si contiene elementos vacíos o con valores, se ignorarán las observaciones correspondientes.groupNaNy

Para obtener más información sobre la agrupación de variables, consulte.Agrupar variables

Por ejemplo, si es un vector, con observaciones categorizadas en los grupos 1, 2 y 3, puede especificar las variables de agrupamiento como se indica a continuación.y

Ejemplo: 'group',[1,2,1,3,1,...,3,1]

Por ejemplo, si es una matriz, con seis columnas categorizadas en grupos rojo, blanco y negro, puede especificar las variables de agrupamiento como se indica a continuación.y

Ejemplo: 'group',{'white','red','white','black','red'}

Tipos de datos: single | double | logical | char | string | cell

Indicador para mostrar la tabla ANOVA y el diagrama de caja, especificados como o.'on''off' When is, devuelve los argumentos de salida, sólo.displayopt'off'anova1 No muestra la tabla ANOVA estándar y la gráfica de caja de las columnas de.y

Ejemplo: p = anova(x,group,'off')

Argumentos de salida

contraer todo

-Value para el-test, devuelto como un valor escalar. -Value es la probabilidad de que la-estadística pueda tomar un valor mayor que el valor de la estadística de prueba calculada. prueba la hipótesis nula de que todos los medios de grupo son iguales entre sí frente a la hipótesis alternativa de que al menos una media de grupo es diferente de las demás.pFpFanova1 La función deriva el-valor de la CDF de la-Distribution.pF

Un valor que es menor que el nivel de significancia indica que al menos uno de los medios de la muestra es significativamente diferente de los otros.p Los niveles de significancia comunes son 0,05 o 0,01.

Tabla ANOVA, devuelta como una matriz de celdas. tiene seis columnas.tbl

ColumnaDefinición
sourceLa fuente de la variabilidad.
SSLa suma de los cuadrados debido a cada fuente.
dfLos grados de libertad asociados a cada fuente. Supongamos que es el número total de observaciones y es el número de grupos.Nk Entonces, – es los grados de libertad dentro de los grupos (), – 1 es el entre-grupos grados de libertad (), y – 1 es el total de grados de libertad. – 1 = (–) + (– 1)NkErrorkColumnsNNNkk
MSLos cuadrados de la media para cada fuente, que es la relación.SS/df
F-Estadística, que es la relación de los cuadrados medio.F
Prob>FEl-Value, que es la probabilidad de que la-estadística puede tomar un valor mayor que el valor de la estadística de prueba calculada. deriva esta probabilidad de la CDF de distribución.pFanova1F

Las filas de la tabla ANOVA muestran la variabilidad en los datos que se dividen por el origen.

FilaDefinición
GroupsVariabilidad debido a las diferencias entre los medios del grupo (grupos de variabilidad)between
ErrorVariabilidad debido a las diferencias entre los datos de cada grupo y la media del grupo (grupos de variabilidad)within
TotalLa variabilidad total

Estadística para, devuelta como una estructura. tiene seis campos.varias pruebas de comparaciónstats

Nombre de campoDefinición
gnamesLos nombres de los grupos
nNúmero de observaciones en cada grupo
sourceFuente de la salidastats
meansLos valores estimados de los medios
dfError (dentro de los grupos) grados de libertad (–, donde es el número total de observaciones y es el número de grupos)NkNk
sRaíz cuadrada del error cuadrado medio

Más acerca de

contraer todo

Box-Plot

Devuelve parcelas de caja de las observaciones en, por grupo.anova1y Los trazados de caja proporcionan una comparación visual de los parámetros de ubicación del grupo.

Si es un vector, la gráfica muestra un cuadro para cada valor de.ygroup Si es una matriz y no se especifica, la gráfica muestra un cuadro para cada columna de.ygroupy En cada caja, la marca central es la mediana y los bordes de la caja son los percentiles 25 y 75 (cuantiles 1º y 3º). Los bigotes se extienden a los puntos de datos más extremos que no se consideran valores atípicos. Los valores atípicos se trazan individualmente. Los puntos finales de intervalo son los extremos de las muescas. Los extremos corresponden a 2 – 1,57 (3 – 1)/sqrt () y 2 + 1,57 (3 – 1)/sqrt (), donde 2 es la mediana (percentil 50), 1 y 3 son los percentiles 25º y 75, respectivamente, y es el número de observaciones sin ningún valor.qqqnqqqnqqqnNaN

Dos medianas son significativamente diferentes en el nivel de significancia del 5% si sus intervalos no se superponen. Esta prueba es diferente de la prueba que realiza ANOVA, pero las grandes diferencias en las líneas de centro de los cuadros corresponden a valores de estadística grandes y valores pequeños correspondientemente.FFp Para obtener más información sobre los trazados de caja, consulte.boxplot

Referencias

[1] Hogg, R. V., and J. Ledolter. Engineering Statistics. New York: MacMillan, 1987.

Introducido antes de R2006a