Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

chi2gof

La prueba de bondad de ajuste de Chi-cuadrado

Descripción

ejemplo

h = chi2gof(x) Devuelve una decisión de prueba para la hipótesis nula de que los datos en Vector proceden de una distribución normal con una media y una varianza estimada a partir de, utilizando el.xxprueba de bondad de ajuste de Chi-cuadrado La hipótesis alternativa es que los datos no provienen de tal distribución. El resultado es que si la prueba rechaza la hipótesis nula en el nivel de significancia del 5%, y de lo contrario.h10

ejemplo

h = chi2gof(x,Name,Value) Devuelve una decisión de prueba para la prueba de bondad de ajuste de Chi-cuadrado con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede probar una distribución que no sea normal o cambiar el nivel de significancia de la prueba.

ejemplo

[h,p] = chi2gof(___) también devuelve el valor-Value de la prueba de hipótesis, utilizando cualquiera de los argumentos de entrada de las sintaxis anteriores.pp

ejemplo

[h,p,stats] = chi2gof(___) también devuelve la estructura, que contiene información sobre la estadística de prueba.stats

Ejemplos

contraer todo

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos utilizando números aleatorios de la distribución.x

pd = makedist('Normal'); rng default;  % for reproducibility x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos proceden de una población con una distribución normal.x

h = chi2gof(x)
h = 0 

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos utilizando números aleatorios de la distribución.x

pd = makedist('Normal'); rng default;  % for reproducibility x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos proceden de una población con una distribución normal al nivel de significancia del 1%.x

[h,p] = chi2gof(x,'Alpha',0.01)
h = 0 
p = 0.3775 

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia del 1%.h = 0chi2gof

Cargue los datos de muestra de duración de la bombilla.

load lightbulb

Cree un vector a partir de la primera columna de la matriz de datos, que contiene la duración en horas de las bombillas.

x = lightbulb(:,1);

Pruebe la hipótesis nula de que los datos proceden de una población con una distribución de Weibull.x Se utiliza para crear un objeto de distribución de probabilidad con y parámetros estimados a partir de los datos.fitdistAB

pd = fitdist(x,'Weibull'); h = chi2gof(x,'CDF',pd)
h = 1 

El valor devuelto indica que rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 1chi2gof

Cree seis bins, numerados de 0 a 5, para utilizarlos en la agrupación de datos.

bins = 0:5;

Cree un vector que contenga los recuentos observados para cada ubicación y calcule el número total de observaciones.

obsCounts = [6 16 10 12 4 2]; n = sum(obsCounts);

Ajuste un objeto de distribución de probabilidad de Poisson a los datos y calcule el recuento esperado para cada bin. Utilice el operador de transposición para transformar y de vectores de fila a vectores de columna..'binsobsCounts

pd = fitdist(bins','Poisson','Frequency',obsCounts'); expCounts = n * pdf(pd,bins);

Pruebe la hipótesis nula de que los datos proceden de una distribución de Poisson con un parámetro lambda igual a.obsCountslambdaHat

[h,p,st] = chi2gof(bins,'Ctrs',bins,...                         'Frequency',obsCounts, ...                         'Expected',expCounts,...                         'NParams',1)
h = 0 
p = 0.4654 
st = struct with fields:
    chi2stat: 2.5550
          df: 3
       edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000]
           O: [6 16 10 12 6]
           E: [7.0429 13.8041 13.5280 8.8383 6.0284]

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof El vector contiene los recuentos esperados para cada bin bajo la hipótesis nula, y contiene los recuentos observados para cada bin.EO

Utilice la función de distribución de probabilidad como un manejador de funciones en la prueba de bondad de ajuste de Chi-cuadrado ().normcdfchi2gof

Pruebe la hipótesis nula de que los datos de ejemplo del vector de entrada proceden de una distribución normal con parámetros e iguales a la media () y la desviación estándar () de los datos de muestra, respectivamente.xµσmeanstd

rng('default') % For reproducibility x = normrnd(50,5,100,1); h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})
h = 0 

El resultado devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

Argumentos de entrada

contraer todo

Datos de ejemplo para la prueba de hipótesis, especificadas como un vector.

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: agrupa los datos en ocho bins y realiza la prueba de hipótesis en el nivel de significancia del 1%.'NBins',8,'Alpha',0.01

Número de bins que se usarán para la agrupación de datos, especificado como el par separado por comas y que consta de un valor entero positivo.'NBins' Si especifica un valor para, no especifique un valor para o.NBinsCtrsEdges

Ejemplo: 'NBins',8

Tipos de datos: single | double

Centros de ubicación, especificados como el par separado por comas que consta de y un vector de valores de centro para cada bin.'Ctrs' Si especifica un valor para, no especifique un valor para o.CtrsNBinsEdges

Ejemplo: 'Ctrs',[1 2 3 4 5]

Tipos de datos: single | double

Aristas de ubicación, especificadas como el par separado por comas que consta de un vector de valores de arista para cada bin.'Edges' Si especifica un valor para, no especifique un valor para o.EdgesNBinsCtrs

Ejemplo: 'Edges',[-2.5 -1.5 -0.5 0.5 1.5 2.5]

Tipos de datos: single | double

La CDF de la distribución hipotética, especificada como el par separado por comas que consta de un objeto de distribución de probabilidad, un identificador de función o una matriz de celdas.'CDF'

  • Si es un objeto de distribución de probabilidad, los grados de libertad tienen en cuenta si se estiman los parámetros utilizando o especificarlos mediante.CDFfitdistmakedist

  • Si es un identificador de función, la función de distribución debe tomar como su único argumento.CDFx

  • Si es una matriz de celdas, el primer elemento debe ser un identificador de función y los elementos restantes deben ser valores de parámetro, uno por celda.CDF La función debe tomar como su primer argumento y los otros parámetros de la matriz como argumentos posteriores.x

Si especifica un valor para, no especifique un valor para.CDFExpected

Ejemplo: 'CDF',pd_object

Tipos de datos: single | double

Recuentos esperados para cada bin, especificados como el par separado por comas y un vector de valores no negativos.'Expected' Si depende de los parámetros estimados, utilice para asegurarse de que calcula correctamente los grados de libertad.ExpectedNParamschi2gof Si especifica un valor para, no especifique un valor para.ExpectedCDF

Ejemplo: 'Expected',[19.1446 18.3789 12.3224 8.2432 4.1378]

Tipos de datos: single | double

Número de parámetros estimados que se utilizan para describir la distribución nula, especificada como el par separado por comas y que consta de un valor entero positivo.'NParams' Este valor ajusta los grados de libertad de la prueba en función del número de parámetros estimados utilizados para calcular el CDF o los recuentos esperados.

El valor predeterminado para depende de cómo especifique la distribución nula:NParams

  • Si se especifica como un objeto de distribución de probabilidad, es igual al número de parámetros estimados utilizados para crear el objeto.CDFNParams

  • Si especifica como un nombre de función o un identificador, el valor predeterminado es.CDFNParams0

  • Si se especifica como una matriz de celdas, el valor predeterminado es el número de parámetros de la matriz.CDFNParams

  • Si especifica, el valor predeterminado es.ExpectedNParams0

Ejemplo: 'NParams',1

Tipos de datos: single | double

Recuento mínimo esperado por bin, especificado como el par separado por comas que consta de y un valor entero no negativo.'EMin' Si el bin en el extremo extremo de cualquiera de las dos cola tiene un valor esperado menor que, se combina con un bin vecino hasta que el conteo en cada bin extremo sea al menos 5.EMin Si alguno de los bins interiores tiene un recuento inferior a 5, muestra una advertencia, pero no combina las bandejas interiores.chi2gof En ese caso, debe utilizar menos bins o proporcionar centros de ubicación o aristas para aumentar los recuentos esperados en todas las ubicaciones. Especifique como para evitar la combinación de bins.EMin0

Ejemplo: 'EMin',0

Tipos de datos: single | double

Frecuencia de los valores de datos, especificado como el par separado por comas que consta de y un vector de valores enteros no negativos que tiene la misma longitud que el vector.'Frequency'x

Ejemplo: 'Frequency',[20 16 13 10 8]

Tipos de datos: single | double

Nivel de significancia de la prueba de hipótesis, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).'Alpha'

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como o.10

  • Si, esto indica el rechazo de la hipótesis nula en el nivel de significancia.h= 1Alpha

  • Si, esto indica un error al rechazar la hipótesis nula en el nivel de significancia.h= 0Alpha

-valor de la prueba, devuelto como un valor escalar en el intervalo [0,1]. es la probabilidad de observar un estadístico de prueba tan extremo como, o más extremo que, el valor observado bajo la hipótesis nula.pp Los valores pequeños de emitir dudas sobre la validez de la hipótesis nula.p

Estadísticas de prueba, devueltas como una estructura que contiene lo siguiente:

  • — Valor del estadístico de prueba.chi2stat

  • — Grados de libertad de la prueba.df

  • — Vector de los bordes de la papelera después de la agrupación.edges

  • — Vector de recuentos observados para cada bin.O

  • — Vector de los recuentos esperados para cada bin.E

Más acerca de

contraer todo

Prueba de bondad de ajuste de Chi-cuadrado

La prueba de bondad de ajuste de Chi-cuadrado determina si una muestra de datos proviene de una distribución de probabilidad especificada, con parámetros estimados a partir de los datos.

La prueba agrupa los datos en bins, calculando los recuentos observados y esperados para esas ubicaciones y calculando el estadístico de prueba de Chi-cuadrado

χ2=i=1N(OiEi)2/Ei,

DóndeOi son los recuentos observados yEi son los recuentos esperados basados en la distribución hipotética. El estadístico de prueba tiene una distribución de Chi-cuadrado aproximada cuando los recuentos son lo suficientemente grandes.

Algoritmos

compara el valor de la estadística de prueba con una distribución de Chi-cuadrada con grados de libertad igual a-1-, donde es el número de bins utilizados para la agrupación de datos y es el número de parámetros estimados utilizados para determinar los recuentos esperados.chi2gofnbinsnparamsnbinsnparams Si no hay suficientes grados de libertad para realizar la prueba, devuelve el valor-Value como.chi2gofpNaN

Capacidades ampliadas

Introducido antes de R2006a