Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

fishertest

La prueba exacta de Fisher

Descripción

ejemplo

h = fishertest(x) Devuelve una decisión de prueba para la prueba exacta de Fisher de la hipótesis nula de que no hay asociaciones no aleatorias entre las dos variables categóricas en, contra la alternativa de que hay una asociación no aleatoria.x El resultado es que si la prueba rechaza la hipótesis nula en el nivel de significancia del 5%, o de otro modo.h10

ejemplo

[h,p,stats] = fishertest(x) también devuelve el nivel de significancia de la prueba y una estructura que contiene resultados de pruebas adicionales, incluyendo la relación de probabilidades y su intervalo de confianza asintótica.pstats

ejemplo

[___] = fishertest(x,Name,Value) Devuelve una decisión de prueba mediante opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede cambiar el nivel de significancia de la prueba o realizar una prueba unilateral.

Ejemplos

contraer todo

En una pequeña encuesta, un investigador preguntó a 17 individuos si recibieron una vacuna contra la gripe este año, y si atraparon la gripe este invierno. Los resultados indican que, de las nueve personas que no han recibido una vacuna contra la gripe, tres tienen la gripe y seis no. De las ocho personas que recibieron una vacuna contra la gripe, una se resfrió y siete no.

Cree una tabla de contingencia 2 por 2 que contenga los datos de la encuesta. La fila 1 contiene datos para las personas que no recibieron una vacuna contra la gripe, y la fila 2 contiene datos para las personas que han recibido una vacuna contra la gripe. La columna 1 contiene el número de individuos que tienen la gripe, y la columna 2 contiene el número de individuos que no lo hicieron.

x = table([3;1],[6;7],'VariableNames',{'Flu','NoFlu'},'RowNames',{'NoShot','Shot'})
x=2×2 table
              Flu    NoFlu
              ___    _____

    NoShot     3       6  
    Shot       1       7  

Utilice la prueba exacta de Fisher para determinar si hay una asociación no aleatoria entre recibir una vacuna contra la gripe y contraer la gripe.

h = fishertest(x)
h = logical
   0

La decisión de prueba devuelta indica que no rechaza la hipótesis nula de ninguna asociación no aleatoria entre las variables categóricas en el nivel de significancia predeterminado del 5%.h = 0fishertest Por lo tanto, en base a los resultados de las pruebas, las personas que no se vacunan contra la gripe no tienen probabilidades diferentes de contraer la gripe que las que se vacunaron contra la gripe.

En una pequeña encuesta, un investigador preguntó a 17 individuos si recibieron una vacuna contra la gripe este año, y si atraparon la gripe. Los resultados indican que, de las nueve personas que no han recibido una vacuna contra la gripe, tres tienen la gripe y seis no. De las ocho personas que recibieron una vacuna contra la gripe, una se resfrió y siete no.

x = [3,6;1,7];

Utilice una prueba exacta de Fisher de cola derecha para determinar si las probabilidades de contraer la gripe son mayores para las personas que no han recibido una vacuna contra la gripe que para las personas que lo hicieron. Realice la prueba al nivel de significancia del 1%.

[h,p,stats] = fishertest(x,'Tail','right','Alpha',0.01)
h = logical
   0

p = 0.3353 
stats = struct with fields:
             OddsRatio: 3.5000
    ConfidenceInterval: [0.1289 95.0408]

La decisión de prueba devuelta indica que no rechaza la hipótesis nula de ninguna asociación no aleatoria entre las variables categóricas en el nivel de significancia del 1%.h = 0fishertest Dado que se trata de una prueba de hipótesis de cola derecha, la conclusión es que las personas que no se vacunan contra la gripe no tienen mayores probabilidades de contraer la gripe que las que se vacunaron contra la gripe.

Cargue los datos del hospital.

load hospital

La matriz de DataSet contiene datos sobre 100 pacientes hospitalarios, incluyendo el apellido, sexo, edad, peso, estado de tabaquismo, y mediciones de la presión arterial sistólica y diastólica.hospital

Para determinar si el estado de tabaquismo es independiente del género, se utiliza para crear una tabla de contingencia de 2 por 2 de fumadores y no fumadores, agrupados por género.crosstab

[tbl,chi2,p,labels] = crosstab(hospital.Sex,hospital.Smoker)
tbl = 2×2

    40    13
    26    21

chi2 = 4.5083 
p = 0.0337 
labels = 2x2 cell array
    {'Female'}    {'0'}
    {'Male'  }    {'1'}

Las filas de la tabla de contingencia resultante corresponden al sexo del paciente, con la fila 1 que contiene datos para las hembras y la fila 2 que contiene datos para varones.tbl Las columnas corresponden al estado de tabaquismo del paciente, con la columna 1 que contiene datos para los no fumadores y la columna 2 que contiene datos para los fumadores. El resultado devuelto es el valor de la estadística de prueba de Chi cuadrado para una prueba de independencia de Chi cuadrado.chi2 = 4.5083 El valor devuelto es un aproximadop = 0.0337

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor basado en la distribución Chi cuadrado.

Utilice la tabla de contingencia generada por para realizar la prueba exacta de Fisher en los datos.crosstab

[h,p,stats] = fishertest(tbl)
h = logical
   1

p = 0.0375 
stats = struct with fields:
             OddsRatio: 2.4852
    ConfidenceInterval: [1.0624 5.8135]

El resultado indica que rechaza la hipótesis nula de no asociación entre el estado de tabaquismo y el sexo en el nivel de significancia del 5%.h = 1fishertest En otras palabras, existe una asociación entre el género y el estado de tabaquismo. La relación de probabilidades indica que los pacientes masculinos tienen unas 2,5 veces mayores probabilidades de ser fumadores que las pacientes femeninas.

El devuelto

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de la prueba,, está cerca, pero no exactamente lo mismo que, el resultado obtenido por.p = 0.0375crosstab Esto es porque computa un exactofishertest
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-Value utilizando los datos de muestra, mientras utiliza una aproximación Chi-cuadrada para calcular elcrosstab
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
valor.

Argumentos de entrada

contraer todo

Tabla de contingencia, especificada como una matriz 2 por 2 o tabla que contiene valores enteros no negativos. Una tabla de contingencia contiene la distribución de frecuencias de las variables en los datos de muestra. Puede utilizar para generar una tabla de contingencia a partir de datos de ejemplo.crosstab

Ejemplo: [4,0;0,4]

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: especifica una prueba de hipótesis de cola derecha en el nivel de significancia del 1%.'Alpha',0.01,'Tail','right'

Nivel de significancia de la prueba de hipótesis, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).'Alpha'

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de hipótesis alternativa, especificada como el par separado por comas que consta de y uno de los siguientes.'Tail'

'both'Prueba de dos colas. La hipótesis alternativa es que hay una asociación no aleatoria entre las dos variables en, y la relación de probabilidades no es igual a 1.x
'right'Prueba de cola derecha. La hipótesis alternativa es que la relación de probabilidades es mayor que 1.
'left'Prueba de cola izquierda. La hipótesis alternativa es que la relación de probabilidades es menor que 1.

Ejemplo: 'Tail','right'

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como un valor lógico.

  • Si es así, rechaza la hipótesis nula en el nivel de significancia.h1fishertestAlpha

  • Si es, entonces no puede rechazar la hipótesis nula en el nivel de significancia.h0fishertestAlpha

-valor de la prueba, devuelto como un valor escalar en el intervalo [0,1]. es la probabilidad de observar un estadístico de prueba tan extremo como, o más extremo que, el valor observado bajo la hipótesis nula.pp Los valores pequeños de emitir dudas sobre la validez de la hipótesis nula.p

Datos de prueba, devueltos como una estructura con los siguientes campos:

  • — Una medida de asociación entre las dos variables.OddsRatio

  • — Intervalo de confianza asintótica para la relación de probabilidades.ConfidenceInterval Si alguna de las frecuencias de celda en son 0, entonces no computa un intervalo de confianza y en su lugar visualiza.xfishertest[-Inf Inf]

Más acerca de

contraer todo

La prueba exacta de Fisher

La prueba exacta de Fisher es una prueba estadística no paramétrica utilizada para probar la hipótesis nula de que no existan asociaciones no aleatorias entre dos variables categóricas, contra la alternativa de que exista una asociación no aleatoria entre las variables.

La prueba exacta de Fisher proporciona una alternativa a la prueba de Chi-cuadrada para muestras pequeñas, o muestras con distribuciones marginales muy irregulares. A diferencia de la prueba de Chi-cuadrada, la prueba exacta de Fisher no depende de suposiciones de distribución de grandes muestras, y en su lugar calcula un valor exacto basado en los datos de muestra.p Aunque la prueba exacta de Fisher es válida para muestras de cualquier tamaño, no se recomienda para muestras grandes porque es computacionalmente intensiva. Si todos los recuentos de frecuencia en la tabla de contingencia son mayores o iguales, entonces los errores.1e7fishertest Para tablas de contingencia que contienen valores de recuento grandes o bien equilibrados, utilice o en su lugar.crosstabchi2gof

acepta una tabla de contingencia 2 por 2 como entrada y calcula el-valor de la prueba de la siguiente manera:fishertestp

  1. Calcule las sumas para cada fila, columna y número total de observaciones en la tabla de contingencia.

  2. Utilizando una generalización multivariada de la función de probabilidad hipergeométrica, calcule la probabilidad condicional de observar el resultado exacto en la tabla de contingencia si la hipótesis nula fuera verdadera, dadas sus sumas de fila y columna. La probabilidad condicional es

    Pcutoff=(R1!R2!)(C1!C2!)N!i,jnij!,

    Dónde R1 Y R2 son las sumas de la fila, C1 Y C2 son las sumas de la columna, es el número total de observaciones en la tabla de contingencia yN nij es el valor de la fila TH y la columna TH de la tabla.ij

  3. Buscar todas las matrices posibles de enteros no negativos coherentes con las sumas de fila y columna. Para cada matriz, calcule la probabilidad condicional asociada utilizando la ecuación para Pcutoff.

  4. Utilice estos valores para calcular el valor de la prueba, en función de la hipótesis alternativa de interés.p

    • Para una prueba bilateral, sume todas las probabilidades condicionales menores o iguales a Pcutoff para la tabla de contingencia observada. Esto representa la probabilidad de observar un resultado tan extremo como, o más extremo que, el resultado real si la hipótesis nula fuera verdadera. Los valores pequeños arrodan dudas sobre la validez de la hipótesis nula, en favor de la hipótesis alternativa de asociación entre las variables.p

    • Para una prueba de lado izquierdo, sume las probabilidades condicionales de todas las matrices con una frecuencia de celda (1, 1) menor o igual que n11.

    • Para una prueba de lado derecho, sume las probabilidades condicionales de todas las matrices con una frecuencia de celda (1, 1) mayor o igual que n11 en la tabla de contingencia observada.

La relación de probabilidades es

OR=n11n22n21n12.

La hipótesis nula de independencia condicional equivale a la hipótesis de que la relación de probabilidades es igual a 1. La alternativa de lado izquierdo equivale a una relación de probabilidades menor que 1, y la alternativa de derecha equivale a una relación de probabilidades mayor que 1.

El intervalo de confianza asintótico 100 (1 – α)% para la relación de probabilidades es

CI=[exp(LΦ1(1α2)SE),exp(L+Φ1(1α2)SE)],

donde está la relación de probabilidades logaritmo,L Φ-1( • ) es la inversa de la función de distribución acumulativa inversa normal, y es el error estándar para la relación de probabilidades de registro.SE Si el intervalo de confianza de 100 (1 – α)% no contiene el valor 1, entonces la asociación es significativa en el nivel de significancia de α. Si cualquiera de las cuatro frecuencias de celda es 0, entonces no computa el intervalo de confianza y en su lugar muestra.fishertest[-Inf Inf]

solo acepta las tablas de contingencia 2 por 2 como entrada.fishertest Para probar la independencia de las variables categóricas con más de dos niveles, utilice la prueba de Chi cuadrado proporcionada por.crosstab

Consulte también

|

Introducido en R2014b