Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

ranksum

Prueba de suma de rangos de Wilcoxon

Descripción

p = ranksum(x,y) devuelve el valor p de una prueba de suma de rangos de Wilcoxon bilateral. ranksum comprueba la hipótesis nula de que los datos de x e y son muestras de distribuciones continuas con medianas idénticas, frente a la alternativa de que no lo son. La prueba asume que las dos muestras son independientes. x e y pueden tener longitudes diferentes.

Esta prueba es equivalente a la prueba U de Mann Whitney.

ejemplo

[p,h] = ranksum(x,y) devuelve también un valor lógico que indica la decisión de la prueba. El resultado h = 1 indica un rechazo de la hipótesis nula, y h = 0 indica un error al rechazar la hipótesis nula al nivel de significación del 5%.

ejemplo

[p,h,stats] = ranksum(x,y) devuelve también la estructura stats con información sobre la estadística de la prueba.

ejemplo

[___] = ranksum(x,y,Name,Value) devuelve cualquier argumento de salida de las sintaxis anteriores para una prueba de suma de rangos con opciones adicionales especificadas por uno o más argumentos de par Name, Value.

ejemplo

Ejemplos

contraer todo

Compruebe la hipótesis de igualdad entre las medianas de dos muestras independientes de tamaños desiguales.

Genere datos de muestra.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

Estas muestras proceden de poblaciones con distribuciones idénticas, salvo por un desplazamiento del 0,25 en la localización.

Compruebe la igualdad de las medianas de x e y.

p = ranksum(x,y)
p = 0.0375

El valor p de 0,0375 indica que ranksum rechaza la hipótesis nula de igualdad entre las medianas al nivel de significación predeterminado del 5%.

Obtenga la estadística de la prueba de igualdad de las medianas de dos poblaciones.

Cargue los datos de muestra.

load mileage

Compruebe si el consumo de combustible es el mismo para el primer y el segundo tipo de coche.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))
p = 0.0043
h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

El valor p, 0,043, y h = 1 indican el rechazo de la hipótesis nula de igualdad entre las medianas al nivel de significación predeterminado del 5%. Dado que los tamaños de las muestras son reducidos (6 cada uno), ranksum calcula el valor p usando el método exacto. La estructura stats incluye únicamente el valor de la estadística de la prueba de suma de rangos.

Compruebe la hipótesis de un aumento de la mediana de la población.

Cargue los datos de muestra.

load('weather.mat');

Los datos meteorológicos muestran las temperaturas altas diarias registradas en el mismo mes durante dos años consecutivos.

Realice una prueba del lado izquierdo para evaluar el aumento de la mediana al nivel de significación del 1%.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')
p = 0.1271
h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

Si nos basamos en el valor p de 0,1271 y en el valor lógico h = 0, no existe evidencia suficiente para rechazar la hipótesis nula. Es decir, los resultados no demuestran la existencia de un desplazamiento positivo de la mediana de las temperaturas altas del mes entre el año 1 y el año 2 al nivel de significación del 1%. Observe que ranksum usa el método aproximado para calcular el valor p debido al elevado tamaño de las muestras.

Use el método exacto para calcular el valor p.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')
p = 0.1273
h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

Los resultados de los métodos aproximado y exacto son congruentes entre sí.

Argumentos de entrada

contraer todo

Los datos de muestra, especificados como un vector.

Tipos de datos: single | double

Los datos de muestra, especificados como un vector. La longitud de y no tiene que ser la misma que la longitud de x.

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'alpha',0.01,'method','approximate','tail','right' especifica una prueba de suma de rangos de cola derecha con un nivel de significación del 1% que devuelve el valor p aproximado.

El nivel de significación de la decisión de una prueba de hipótesis, especificado como el par separado por comas que consta de 'alpha' y un valor de escalar en el rango del 0 al 1. El nivel de significación de h es 100 * alpha%.

Ejemplo: 'alpha', 0.01

Tipos de datos: double | single

El método de cálculo del valor p, p, especificado como el par separado por comas que consta de 'method' y uno de los siguientes:

'exact'El cálculo exacto del valor p, p.
'approximate'La aproximación normal al calcular el valor p, p.

Cuando 'method' no está especificado, el valor predeterminado es:

  • 'exact' si min(nx, ny) < 10 y nx + ny < 20

  • 'approximate' en caso contrario

nx y ny son los tamaños de las muestras de x e y, respectivamente.

Ejemplo: 'method','exact'

El tipo de prueba, especificado como el par separado por comas que consta de 'tail' y uno de los siguientes:

'both'Una prueba de hipótesis bilateral en la que la hipótesis alternativa afirma que x e y tienen diferentes medianas. El tipo de prueba predeterminado si no se especifica 'tail'.
'right'Una prueba de hipótesis de cola derecha en la que la hipótesis alternativa afirma que la mediana de x es mayor que la mediana de y.
'left'Una prueba de hipótesis de cola izquierda en la que la hipótesis alternativa afirma que la mediana de x es menor que la mediana de y.

Ejemplo: 'tail','left'

Argumentos de salida

contraer todo

El valor p de la prueba, devuelto como un escalar positivo del 0 al 1. p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. ranksum calcula el valor p bilateral duplicando el valor unilateral más significativo.

El resultado de la prueba de hipótesis, devuelto como un valor lógico.

  • Si h = 1, esto indica el rechazo de la hipótesis nula al nivel de significación del 100 * alpha%.

  • Si h = 0, esto indica un error al rechazar la hipótesis nula al nivel de significación del 100 * alpha%.

Las estadísticas de la prueba, devueltas como una estructura. Las estadísticas de la prueba almacenadas en stats son:

  • ranksum : Valor de la estadística de la prueba de suma de rangos

  • zval: El valor de la estadística z (calculado cuando 'method' es 'approximate')

Más acerca de

contraer todo

Prueba de suma de rangos de Wilcoxon

La prueba de suma de rangos de Wilcoxon es una prueba no paramétrica para dos poblaciones cuando las muestras son independientes. Si X e Y son muestras independientes con diferentes tamaños de muestra, la estadística de la prueba que devuelve ranksum es la suma de los rangos de la primera muestra.

La prueba de suma de rangos de Wilcoxon es equivalente a la prueba U de Mann Whitney. La prueba U de Mann Whitney es una prueba no paramétrica de igualdad de las medianas de las poblaciones de dos muestras independientes X e Y.

La estadística de la prueba U de Mann Whitney, U, es el número de veces que una y precede a una x en un arreglo ordenado de los elementos de dos muestras independientes X e Y. Está relacionada con la estadística de la suma de rangos de Wilcoxon de la siguiente forma: si X es una muestra de tamaño nX,

U=WnX(nX+1)2.

Estadística z

Cuando las muestras son grandes, ranksum usa una estadística z para calcular el valor p aproximado de la prueba.

Si X e Y son dos muestras independientes de tamaño nX e nY, donde nX < nY, la estadística de z es

z=WE(W)V(W)=W[nXnY+nX(nX+1)2]0.5sign(WE(W))nXnY(nX+nY+1tiescor)12,

con corrección de continuidad y ajuste de los empates. Aquí tiescor lo da

tiescor=2tieadj(nX+nY)(nX+nY1),

, donde ranksum usa [ranks,tieadj] = tiedrank(x,y) para obtener los ajustes de los empates. La distribución normal estándar da el valor p para esta estadística z.

Algoritmos

ranksum trata NaN en x e y como valores faltantes y los ignora.

En el caso de las pruebas bilaterales de medianas con diferentes tamaños de muestra, la estadística de la prueba que devuelve ranksum es la suma de los rangos de la primera muestra.

Referencias

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

Historial de versiones

Introducido antes de R2006a

Consulte también

| | |