Main Content

lillietest

Prueba de Lilliefors

Descripción

ejemplo

h = lillietest(x) devuelve una decisión de prueba para la hipótesis nula de que los datos del vector x proceden de una distribución de la familia normal, frente a la alternativa de que no proceden de tal distribución, utilizando una prueba de Lilliefors. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = lillietest(x,Name,Value) devuelve una decisión de prueba con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede probar los datos con una familia de distribución diferente, cambiar el nivel de significación o calcular el valor de p mediante una aproximación de Montecarlo.

ejemplo

[h,p] = lillietest(___) también devuelve el valor de p p, utilizando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,kstat,critval] = lillietest(___) también devuelve las estadísticas de la prueba kstat y el valor crítico critval para la prueba.

Ejemplos

contraer todo

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución normal en las diferentes marcas de coches.

load carbig
[h,p,k,c] = lillietest(MPG)
Warning: P is less than the smallest tabulated value, returning 0.001.
h = 1
p = 1.0000e-03
k = 0.0789
c = 0.0451

La estadística de la prueba k es mayor que el valor crítico c, por lo que lillietest devuelve un resultado de h = 1 para indicar el rechazo de la hipótesis nula al nivel de significación predeterminado del 5%. La advertencia indica que el valor p devuelto es menor que el valor más pequeño de la tabla de valores precalculados. Para encontrar un valor p más exacto, utilice MCTol para ejecutar una aproximación de Montecarlo. Consulte Determinar el valor de p utilizando la aproximación de Montecarlo.

Cargue los datos de muestra. Cree un vector que contenga la primera columna de los datos de las notas de los alumnos en un examen.

load examgrades
x = grades(:,1);

Pruebe la hipótesis nula de que los datos de la muestra proceden de una distribución normal al nivel de significación del 1%.

[h,p] = lillietest(x,'Alpha',0.01)
h = 0
p = 0.0348

El valor devuelto de h = 0 indica que lillietest no rechaza la hipótesis nula al nivel de significación del 1%.

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución exponencial en las diferentes marcas de coches.

load carbig
h = lillietest(MPG,'Distribution','exponential')
h = 1

El valor devuelto de h = 1 indica que lillietest rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Genere dos conjuntos de datos de muestra, uno a partir de una distribución de Weibull y otro a partir de una distribución lognormal. Efectúe la prueba de Lilliefors para evaluar si cada conjunto de datos procede de una distribución de Weibull. Confirme la decisión de la prueba realizando una comparación visual utilizando una gráfica de probabilidad de Weibull (wblplot).

Genere muestras a partir de una distribución de Weibull.

rng('default')
data1 = wblrnd(0.5,2,[500,1]);

Realice la prueba de Lilliefors utilizando lillietest. Para probar si los datos tienen una distribución de Weibull, pruebe si el logaritmo de los datos tiene una distribución de valores extremos.

h1 = lillietest(log(data1),'Distribution','extreme value')
h1 = 0

El valor devuelto de h1 = 0 indica que lillietest no rechaza la hipótesis nula al nivel de significación predeterminado del 5%. Confirme la decisión de la prueba mediante una gráfica de probabilidad de Weibull.

wblplot(data1)

La gráfica indica que los datos siguen una distribución de Weibull.

Genere muestras a partir de una distribución lognormal.

data2 =lognrnd(5,2,[500,1]);

Realice la prueba de Lilliefors.

h2 = lillietest(log(data2),'Distribution','extreme value')
h2 = 1

El valor devuelto de h2 = 1 indica que lillietest rechaza la hipótesis nula al nivel de significación predeterminado del 5%. Confirme la decisión de la prueba mediante una gráfica de probabilidad de Weibull.

wblplot(data2)

La gráfica indica que los datos no siguen una distribución de Weibull.

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución normal en las diferentes marcas de coches. Determine el valor de p utilizando una aproximación de Montecarlo con un error estándar máximo de Montecarlo de 1e-4.

load carbig
[h,p] = lillietest(MPG,'MCTol',1e-4)
h = 1
p = 8.3333e-06

El valor devuelto de h = 1 indica que lillietest rechaza la hipótesis nula de que los datos proceden de una distribución normal al nivel de significación del 5%.

Argumentos de entrada

contraer todo

Datos de muestra, especificados como un vector.

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Distribution','exponential','Alpha',0.01 pone a prueba la hipótesis nula de que la distribución de la población pertenece a la familia de distribuciones exponenciales al nivel de significación del 1%.

Nivel de significación de la prueba de hipótesis, especificado como el par separado por comas que consta de 'Alpha' y un valor de escalar en el rango (0,1).

  • Si no se utiliza MCTol, Alpha debe estar en el rango [0.001,0.50].

  • Si se utiliza MCTol, Alpha debe estar en el rango (0,1).

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Familia de distribuciones para la prueba de hipótesis, especificada como el par separado por comas que consta de 'Distr' y uno de las siguientes.

'normal'Distribución normal
'exponential'Distribución exponencial
'extreme value'Distribución de valores extremos

  • Para probar si x tiene una distribución lognormal, pruebe si log(x) tiene una distribución normal.

  • Para probar si x tiene una distribución de Weibull, pruebe si log(x) tiene una distribución de valores extremos.

Ejemplo: 'Distribution','exponential'

Error estándar máximo de Montecarlo para p, el valor p de la prueba, especificado como el par separado por comas que consta de 'MCTol' y un valor escalar en el rango (0,1).

Ejemplo: 'MCTol',0.001

Tipos de datos: single | double

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como 1 o 0.

  • Si h= 1, esto indica el rechazo de la hipótesis nula al nivel de significación Alpha.

  • Si h= 0, esto indica un error al rechazar la hipótesis nula al nivel de significación Alpha.

Valor p de la prueba, devuelto como un valor de escalar en el rango (0,1). p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. Los valores pequeños de p ponen en duda la validez de la hipótesis nula.

  • Si no se utiliza MCTol, p se calcula mediante interpolación inversa en la tabla de valores críticos y se devuelve como un valor escalar en el rango [0.001,0.50]. lillietest avisa cuando p no se encuentra dentro del rango tabulado y devuelve el valor tabulado más pequeño o el más grande.

  • Si se utiliza MCTol, lillietest realiza una simulación de Montecarlo para calcular un valor de p más preciso, y p se devuelve como un valor de escalar en el rango (0,1).

Estadística de prueba, devuelta como un valor de escalar no negativo.

Valor crítico para la prueba de hipótesis, devuelto como valor escalar no negativo.

Más acerca de

contraer todo

Prueba de Lilliefors

La prueba de Lilliefors es una prueba bilateral de bondad de ajuste adecuada cuando se desconocen los parámetros de la distribución nula y deben estimarse. Esto contrasta con la prueba de Kolmogorov-Smirnov de una muestra, que requiere que la distribución nula esté completamente especificada.

La estadística de prueba de Lilliefors es:

D*=maxx|F^(x)G(x)|,

donde F^(x) es la cdf empírica de los datos de la muestra y G(x) es la cdf de la distribución hipotética con parámetros estimados iguales a los parámetros de la muestra.

Se puede utilizar lillietest para probar si el vector de datos x tiene una distribución lognormal o de Weibull aplicando una transformación al vector de datos y ejecutando la prueba de Lilliefors adecuada:

  • Para probar si x tiene una distribución lognormal, pruebe si log(x) tiene una distribución normal.

  • Para probar si x tiene una distribución de Weibull, pruebe si log(x) tiene una distribución de valores extremos.

La prueba de Lilliefors no puede utilizarse cuando la hipótesis nula no es una familia de distribuciones de localización y escala.

Error estándar de Montecarlo

El error estándar de Montecarlo es el error debido a la simulación del valor p.

El error estándar de Montecarlo se calcula como

SE=(p^)(1p^)mcreps,

donde p^ es el valor de p estimado de la prueba de hipótesis y mcreps es el número de réplicas de Montecarlo realizadas.

El número de réplicas de Montecarlo, mcreps, se determina de forma que el error estándar de Montecarlo para p^ sea inferior al valor especificado para MCTol.

Algoritmos

Para calcular el valor crítico de la prueba de hipótesis, lillietest interpola en una tabla de valores críticos precalculados utilizando la simulación de Montecarlo para tamaños de muestra inferiores a 1000 y niveles de significación entre 0,001 y 0,50. La tabla utilizada por lillietest es mayor y más precisa que la tabla introducida originalmente por Lilliefors. Si se desea un valor de p más exacto o si el nivel de significación deseado es inferior a 0,001 o superior a 0,50, puede utilizarse el argumento de entrada MCTol para ejecutar una simulación de Montecarlo y calcular el valor de p con mayor exactitud.

Cuando el valor calculado de la estadística de prueba es mayor que el valor crítico, lillietest rechaza la hipótesis nula al nivel de significación Alpha.

lillietest trata los valores NaN de x como valores faltantes y los ignora.

Referencias

[1] Conover, W. J. Practical Nonparametric Statistics. Hoboken, NJ: John Wiley & Sons, Inc., 1980.

[2] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown.” Journal of the American Statistical Association. Vol. 64, 1969, pp. 387–389.

[3] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for normality with mean and variance unknown.” Journal of the American Statistical Association. Vol. 62, 1967, pp. 399–402.

Historial de versiones

Introducido antes de R2006a

Consulte también

| | | |