Main Content

ttest2

Prueba t de dos muestras

Descripción

ejemplo

h = ttest2(x,y) devuelve una decisión de prueba para la hipótesis nula de que los datos de los vectores x e y proceden de muestras aleatorias independientes procedentes de una distribuciones normales con medias iguales y varianzas iguales pero desconocidas usando la prueba t de dos muestras. La hipótesis alternativa es que los datos de x e y proceden de poblaciones con medias desiguales. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = ttest2(x,y,Name,Value) devuelve una decisión de prueba para la prueba t de dos muestras con más opciones especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede cambiar el nivel de significación o realizar la prueba sin asumir la igualdad de las varianzas.

ejemplo

[h,p] = ttest2(___) también devuelve el valor p, p, de la prueba, usando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,ci,stats] = ttest2(___) devuelve también el intervalo de confianza de la diferencia de medias de la población, ci, y la estructura stats, que contiene información sobre la estadística de la prueba.

Ejemplos

contraer todo

Cargue el conjunto de datos. Cree vectores que contengan la primera y la segunda columna de la matriz de datos para representar las notas de unos alumnos en dos exámenes.

load examgrades
x = grades(:,1);
y = grades(:,2);

Pruebe la hipótesis nula de que dos muestras de datos proceden de poblaciones con medias iguales.

[h,p,ci,stats] = ttest2(x,y)
h = 0
p = 0.9867
ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

El valor devuelto de h = 0 indica que ttest2 no rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Cargue el conjunto de datos. Cree vectores que contengan la primera y la segunda columna de la matriz de datos para representar las notas de unos alumnos en dos exámenes.

load examgrades
x = grades(:,1);
y = grades(:,2);

Pruebe la hipótesis nula de que dos vectores de datos proceden de poblaciones con medias iguales, sin asumir que las poblaciones también tienen varianzas iguales.

[h,p] = ttest2(x,y,'Vartype','unequal')
h = 0
p = 0.9867

El valor devuelto de h = 0 indica que ttest2 no rechaza la hipótesis nula al nivel de significación predeterminado del 5% incluso si no se asume la igualdad de varianzas.

Cargue los datos de muestra. Cree un vector categórico para etiquetar los datos de consumo de un vehículo según el año de este.

load carbig.mat;

decade = categorical(Model_Year < 80,[true,false],["70s","80s"]);

Cree gráficas de caja con los datos de consumo para cada década.

boxchart(decade,MPG)
xlabel("Decade")
ylabel("Mileage")

Cree vectores a partir de los datos de consumo para cada década. Utilice una prueba t de cola izquierda para dos muestras para probar la hipótesis nula de que los datos proceden de poblaciones con medias iguales. Utilice la hipótesis alternativa de que la media de la población para el consumo de los vehículos fabricados en la década de los 70 es menor que la media de la población para los vehículos fabricados en la década de los 80.

MPG70s = MPG(decade == "70s");
MPG80s = MPG(decade == "80s");

[h,~,~,stats] = ttest2(MPG70s,MPG80s,"Tail","left")
h = 1
stats = struct with fields:
    tstat: -14.0630
       df: 396
       sd: 6.3910

El valor devuelto de h = 1 indica que ttest2 rechaza la hipótesis nula al nivel de significación predeterminado del 5% en favor de la hipótesis alternativa de que la media de la población para el consumo de los vehículos fabricados en la década de los 70 es menor que la media de la población para los vehículos fabricados en la década de los 80.

Represente la distribución t de Student correspondiente, la estadística t devuelta y el valor de t crítico. Calcule el valor de t crítico en el nivel de confianza predeterminado del 95% utilizando tinv.

nu = stats.df;
k = linspace(-15,15,300);
tdistpdf = tpdf(k,nu);
tval = stats.tstat
tval = -14.0630
tvalpdf = tpdf(tval,nu);
tcrit = -tinv(0.95,nu)
tcrit = -1.6487
plot(k,tdistpdf)
hold on
scatter(tval,tvalpdf,"filled")
xline(tcrit,"--")
legend(["Student's t pdf","t-statistic", ...
    "Critical Cutoff"])

El punto naranja representa la estadística t y se ubica a la izquierda de la línea negra discontinua que representa el valor de t crítico.

Argumentos de entrada

contraer todo

Los datos de muestra, especificados como un vector, una matriz o un arreglo multidimensional. ttest2 trata los valores NaN como datos faltantes y los ignora.

  • Si x e y se especifican como vectores, no es necesario que tengan la misma longitud.

  • Si x e y se especifican como matrices, deben tener el mismo número de columnas. ttest2 realiza una prueba t independiente a lo largo de cada columna y devuelve un vector de resultados.

  • Si x e y se especifican como arreglos multidimensionales, deben tener el mismo tamaño a lo largo de todas las dimensiones, salvo de la primera dimensión no singular.

Tipos de datos: single | double

Los datos de muestra, especificados como un vector, una matriz o un arreglo multidimensional. ttest2 trata los valores NaN como datos faltantes y los ignora.

  • Si x e y se especifican como vectores, no es necesario que tengan la misma longitud.

  • Si x e y se especifican como matrices, deben tener el mismo número de columnas. ttest2 realiza una prueba t independiente a lo largo de cada columna y devuelve un vector de resultados.

  • Si x e y se especifican como arreglos multidimensionales, deben tener el mismo tamaño a lo largo de todas las dimensiones, salvo de la primera dimensión no singular. ttest2 funciona a lo largo de la primera dimensión no singular.

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Tail','right','Alpha',0.01,'Vartype','unequal' especifica una prueba de cola derecha al nivel de significación del 1% y no asume que las varianzas de población de x e y sean iguales.

Nivel de significación de la prueba de hipótesis, especificado como el par separado por comas que consta de 'Alpha' y un valor de escalar en el rango (0,1).

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Dimensión de la matriz de entrada a lo largo de la que se desea probar las medias, especificada como el par separado por comas que consta de 'Dim' y un valor entero positivo. Por ejemplo, especificar 'Dim',1 prueba las medias de las columnas, mientras que 'Dim',2 prueba las medias de las filas.

Ejemplo: 'Dim',2

Tipos de datos: single | double

El tipo de hipótesis alternativa a evaluar, especificada como el par separado por comas que consta de 'Tail' y uno de los siguientes:

  • 'both': comprueba la hipótesis alternativa de que las medias de las poblaciones no son iguales.

  • 'right': comprueba la hipótesis alternativa de que la media de la población de x es mayor que la media de la población de y.

  • 'left': comprueba la hipótesis alternativa de que la media de la población de x es menor que la media de la población de y.

ttest2 comprueba la hipótesis nula de que las medias de las poblaciones son iguales frente a la hipótesis alternativa especificada.

Ejemplo: 'Tail','right'

El tipo de varianza, especificada como el par separado por comas que consta de 'Vartype' y uno de los siguientes.

'equal'Realice la prueba usando el supuesto de que x e y proceden de distribuciones normales con varianzas iguales pero desconocidas.
'unequal'Realice la prueba usando el supuesto de que x e y proceden de distribuciones normales con varianzas desconocidas y desiguales. Esto se denomina problema de Behrens-Fisher. ttest2 usa la aproximación de Satterthwaite para los grados de libertad efectivos.

Vartype debe ser un solo tipo de varianza, incluso cuando x sea una matriz o un arreglo multidimensional.

Ejemplo: 'Vartype','unequal'

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como 1 o 0.

  • Si h= 1, esto indica el rechazo de la hipótesis nula al nivel de significación Alpha.

  • Si h= 0, esto indica un error al rechazar la hipótesis nula al nivel de significación Alpha.

Valor p de la prueba, devuelto como un valor de escalar en el rango [0,1]. p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. Los valores pequeños de p ponen en duda la validez de la hipótesis nula.

El intervalo de confianza para la diferencia de las medias de población de x e y, devueltas como un vector de dos elementos que contiene los límites inferior y superior del intervalo de confianza 100 × (1 – Alpha)%.

La estadística de prueba para la prueba t de dos muestras, devueltas como una estructura que contiene lo siguiente:

  • tstat: el valor de la estadística de la prueba.

  • df: los grados de libertad de la prueba.

  • sd: la estimación combinada de la desviación estándar de la población (en el caso de varianzas iguales) o un vector que contiene las estimaciones combinadas de las desviaciones estándar de la población (en el caso de varianzas desiguales).

Más acerca de

contraer todo

Prueba t de dos muestras

La prueba t de dos muestras es una prueba paramétrica que compara el parámetro de localización de dos muestras de datos independientes.

La estadística de la prueba es

t=x¯y¯sx2n+sy2m,

, donde x¯ y y¯ son las medias de las muestras, sx e sy son las desviaciones estándar de las muestras y n y m son los tamaños de las muestras.

En el caso en el que se asume que las dos muestras de datos proceden de poblaciones con varianzas iguales, la estadística de la prueba bajo la hipótesis nula tiene la distribución t de Student con n + m – 2 grados de libertad, y las desviaciones estándar de las muestras son sustituidas por la desviación estándar combinada

s=(n1)sx2+(m1)sy2n+m2.

En el caso en el que no se asume que las dos muestras de datos proceden de poblaciones con varianzas iguales, la estadística de la prueba bajo la hipótesis nula tiene una distribución t de Student aproximada con un número de grados de libertad dado por la aproximación de Satterthwaite. Esta prueba se denomina a veces prueba t de Welch.

Arreglo multidimensional

Un arreglo multidimensional tiene más de dos dimensiones. Por ejemplo, si x es un arreglo de 1 por 3 por 4, x devuelve un arreglo tridimensional.

Primera dimensión no singular

La primera dimensión no singular es la primera dimensión de un arreglo cuyo tamaño no es igual a 1. Por ejemplo, si x es un arreglo de 1 por 2 por 3 por 4, la segunda dimensión es la primera dimensión no singular de x.

Sugerencias

  • Use sampsizepwr para calcular:

    • el tamaño de la muestra que corresponde a los valores especificados de los parámetros y las potencias;

    • la potencia alcanzada para un tamaño de muestra en particular, dado el valor real de los parámetros;

    • el valor detectable de los parámetros con el tamaño de muestra y la potencia especificados.

Capacidades ampliadas

Historial de versiones

Introducido antes de R2006a

Consulte también

| |