Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

kruskalwallis

La prueba de Kruskal-Wallis

Descripción

ejemplo

p = kruskalwallis(x) Devuelve el valor-Value de la hipótesis nula de que los datos de cada columna de la matriz proceden de la misma distribución, utilizando un.pxLa prueba de Kruskal-Wallis La hipótesis alternativa es que no todas las muestras provienen de la misma distribución. también devuelve una tabla ANOVA y un diagrama de caja.kruskalwallis

ejemplo

p = kruskalwallis(x,group) Devuelve el valor-Value para una prueba de la hipótesis nula de que los datos de cada grupo categórico, según lo especificado por la variable de agrupación proceden de la misma distribución.pgroup La hipótesis alternativa es que no todos los grupos provienen de la misma distribución.

ejemplo

p = kruskalwallis(x,group,displayopt) Devuelve el valor-Value de la prueba y le permite mostrar o suprimir la gráfica de tabla y de cuadro ANOVA.p

ejemplo

[p,tbl,stats] = kruskalwallis(___) también devuelve la tabla ANOVA como la matriz de celdas y la estructura que contiene información sobre las estadísticas de prueba.tblstats

Ejemplos

contraer todo

Cree dos objetos de distribución de probabilidad normal diferentes. La primera distribución tiene y, y la segunda distribución tiene.mu = 0sigma = 1mu = 2 | and |sigma = 1

pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);

Cree una matriz de datos de muestra generando números aleatorios a partir de estas dos distribuciones.

rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];

Las dos primeras columnas de contienen datos generados a partir de la primera distribución, mientras que la tercera columna contiene datos generados a partir de la segunda distribución.x

Pruebe la hipótesis nula de que los datos de ejemplo de cada columna proceden de la misma distribución.x

p = kruskalwallis(x)

p = 3.6896e-06 

El valor devuelto de indica que rechaza la hipótesis nula de que las tres muestras de datos proceden de la misma distribución con un nivel de significancia del 1%.pkruskalwallis La tabla ANOVA proporciona resultados de pruebas adicionales y el diagrama de caja presenta visualmente las estadísticas de Resumen de cada columna.x

Cree dos objetos de distribución de probabilidad normal diferentes. La primera distribución tiene y.mu = 0sigma = 1 La segunda distribución tiene.mu = 2 | and |sigma = 1

pd1 = makedist('Normal'); pd2 = makedist('Normal','mu',2,'sigma',1);

Cree una matriz de datos de muestra generando números aleatorios a partir de estas dos distribuciones.

rng('default'); % for reproducibility x = [random(pd1,20,2),random(pd2,20,1)];

Las dos primeras columnas de contienen datos generados a partir de la primera distribución, mientras que la tercera columna contiene datos generados a partir de la segunda distribución.x

Pruebe la hipótesis nula de que los datos de ejemplo de cada columna proceden de la misma distribución.x Suprima las visualizaciones de salida y genere la estructura que se utilizará en las pruebas posteriores.stats

[p,tbl,stats] = kruskalwallis(x,[],'off')
p = 3.6896e-06 
tbl = 4x6 cell array
  Columns 1 through 5

    {'Source' }    {'SS'        }    {'df'}    {'MS'        }    {'Chi-sq'  }
    {'Columns'}    {[7.6311e+03]}    {[ 2]}    {[3.8155e+03]}    {[ 25.0200]}
    {'Error'  }    {[1.0364e+04]}    {[57]}    {[  181.8228]}    {0x0 double}
    {'Total'  }    {[     17995]}    {[59]}    {0x0 double  }    {0x0 double}

  Column 6

    {'Prob>Chi-sq'}
    {[ 3.6896e-06]}
    {0x0 double   }
    {0x0 double   }

stats = struct with fields:
       gnames: [3x1 char]
            n: [20 20 20]
       source: 'kruskalwallis'
    meanranks: [26.7500 18.9500 45.8000]
         sumt: 0

El valor devuelto indica que la prueba rechaza la hipótesis nula en el nivel de significancia del 1%.p Puede utilizar la estructura para realizar pruebas de seguimiento adicionales.stats La matriz de celdas contiene los mismos datos que la tabla ANOVA gráfica, incluidas las etiquetas de columna y fila.tbl

Realice una prueba de seguimiento para identificar qué muestra de datos proviene de una distribución diferente.

c = multcompare(stats)
Note: Intervals can be used for testing but are not simultaneous confidence intervals. 

c = 3×6

    1.0000    2.0000   -5.1435    7.8000   20.7435    0.3345
    1.0000    3.0000  -31.9935  -19.0500   -6.1065    0.0016
    2.0000    3.0000  -39.7935  -26.8500  -13.9065    0.0000

Los resultados indican que hay una diferencia significativa entre los grupos 1 y 3, por lo que la prueba rechaza la hipótesis nula de que los datos de estos dos grupos proceden de la misma distribución. Lo mismo ocurre con los grupos 2 y 3. Sin embargo, no hay una diferencia significativa entre los grupos 1 y 2, por lo que la prueba no rechaza la hipótesis nula de que estos dos grupos proceden de la misma distribución. Por lo tanto, estos resultados sugieren que los datos en los grupos 1 y 2 provienen de la misma distribución, y los datos en el grupo 3 provienen de una distribución diferente.

Cree un vector, que contenga mediciones de la fuerza de las vigas metálicas.strength Cree un segundo vector, indicando el tipo de aleación metálica a partir de la cual se hace la viga correspondiente.alloy

strength = [82 86 79 83 84 85 86 87 74 82 ...             78 75 76 77 79 79 77 78 82 79];  alloy = {'st','st','st','st','st','st','st','st',...          'al1','al1','al1','al1','al1','al1',...          'al2','al2','al2','al2','al2','al2'};

Pruebe la hipótesis nula de que las mediciones de fuerza del haz tienen la misma distribución en las tres aleaciones.

p = kruskalwallis(strength,alloy,'off')
p = 0.0018 

El valor devuelto indica que la prueba rechaza la hipótesis nula en el nivel de significancia del 1%.p

Argumentos de entrada

contraer todo

Datos de muestra para la prueba de hipótesis, especificados como vector o por matriz.mn Si es una-por-matriz, cada una de las columnas representa una muestra independiente que contiene observaciones mutuamente independientes.xmnnm

Tipos de datos: single | double

Variable de agrupación, especificada como un vector numérico o lógico, un carácter o matriz de cadena, o una matriz de celdas de vectores de caracteres.

  • Si es un vector, cada elemento identifica el grupo al que pertenece el elemento correspondiente y debe ser un vector de la misma longitud que.xgroupxgroupx Si una fila de contiene un valor vacío, se descarta esa fila y la observación correspondiente. valores en cualquiera o se ignoran de forma similar.groupxNaNxgroup

  • Si es una matriz, cada columna en representa un grupo diferente, y puede usar para especificar etiquetas para estas columnas.xxgroup El número de elementos en y el número de columnas en debe ser igual.groupx

Las etiquetas contenidas en también anotan el diagrama de caja.group

Ejemplo: {'red','blue','green','blue','red','blue','green','green','red'}

Tipos de datos: single | double | logical | char | string | cell

Opción de visualización, especificada como o.'on''off' Si es así, muestra las figuras siguientes:displayopt'on'kruskalwallis

  • Una tabla ANOVA que contiene las sumas de los cuadrados, los grados de libertad y otras cantidades calculadas en función de las filas de los datos.x

  • Un diagrama de caja de los datos en cada columna de la matriz de datos.x Los trazados de caja se basan en los valores de datos reales, en lugar de en los rangos.

Si es así, no muestra estas cifras.displayopt'off'kruskalwallis

Si especifica un valor para, también debe especificar un valor para.displayoptgroup Si no tiene una variable de agrupación, especifique as.group[]

Ejemplo: 'off'

Argumentos de salida

contraer todo

-valor de la prueba, devuelto como un valor escalar en el intervalo [0,1]. es la probabilidad de observar un estadístico de prueba tan extremo como, o más extremo que, el valor observado bajo la hipótesis nula.pp Los valores pequeños de emitir dudas sobre la validez de la hipótesis nula.p

Tabla ANOVA de resultados de pruebas, devuelta como una matriz de celdas. incluye las sumas de los cuadrados, los grados de libertad y otras cantidades calculadas en función de las filas de los datos, así como de las etiquetas de columna y fila.tblx

Datos de prueba, devueltos como una estructura. Puede realizar las pruebas de comparación múltiples de seguimiento en pares de medianas de muestra mediante el uso, con como el valor de entrada.multcomparestats

Más acerca de

contraer todo

Prueba de Kruskal-Wallis

La prueba de Kruskal-Wallis es una versión no paramétrica de ANOVA clásica de un solo sentido, y una extensión de la prueba de suma de rango de Wilcoxon a más de dos grupos. Compara las medianas de los grupos de datos para determinar si las muestras provienen de la misma población (o, equivalentemente, de diferentes poblaciones con la misma distribución).x

La prueba de Kruskal-Wallis utiliza rangos de los datos, en lugar de valores numéricos, para calcular las estadísticas de prueba. Encuentra rangos ordenando los datos de menor a mayor en todos los grupos y tomando el índice numérico de este orden. El rango para una observación atada es igual al rango promedio de todas las observaciones vinculadas con ella. La-estadística utilizada en el ANOVA clásico de un solo sentido se sustituye por un estadístico de Chi-cuadrado, y el valor-mide la importancia del estadístico de Chi-cuadrado.Fp

La prueba de Kruskal-Wallis asume que todas las muestras provienen de poblaciones que tienen la misma distribución continua, además de ubicaciones posiblemente diferentes debido a efectos de grupo, y que todas las observaciones son mutuamente independientes. Por el contrario, el ANOVA clásico de una vía sustituye a la primera suposición con la suposición más fuerte de que las poblaciones tienen distribuciones normales.

Introducido antes de R2006a