lillietest

Prueba de Lilliefors

Sintaxis

h = lillietest(x)

h = lillietest(x,Name,Value)

[h,p] = lillietest(___)

[h,p,kstat,critval] = lillietest(___)

Descripción

h = lillietest(x) devuelve una decisión de prueba para la hipótesis nula de que los datos del vector x proceden de una distribución de la familia normal, frente a la alternativa de que no proceden de tal distribución, utilizando una prueba de Lilliefors. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = lillietest(x,Name,Value) devuelve una decisión de prueba con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede probar los datos con una familia de distribución diferente, cambiar el nivel de significación o calcular el valor de p mediante una aproximación de Montecarlo.

ejemplo

[h,p] = lillietest(___) también devuelve el valor de p p, utilizando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,kstat,critval] = lillietest(___) también devuelve las estadísticas de la prueba kstat y el valor crítico critval para la prueba.

ejemplo

Ejemplos

contraer todo

Prueba de la distribución normal

Abrir script en vivo

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución normal en las diferentes marcas de coches.

load carbig
[h,p,k,c] = lillietest(MPG)

Warning: P is less than the smallest tabulated value, returning 0.001.

h = 
1

p = 
1.0000e-03

k = 
0.0789

c = 
0.0451

La estadística de la prueba k es mayor que el valor crítico c, por lo que lillietest devuelve un resultado de h = 1 para indicar el rechazo de la hipótesis nula al nivel de significación predeterminado del 5%. La advertencia indica que el valor $p$ devuelto es menor que el valor más pequeño de la tabla de valores precalculados. Para encontrar un valor $p$ más exacto, utilice MCTol para ejecutar una aproximación de Montecarlo. Consulte Determinar el valor de p utilizando la aproximación de Montecarlo.

Probar la hipótesis con distintos niveles de significación

Abrir script en vivo

Cargue los datos de muestra. Cree un vector que contenga la primera columna de los datos de las notas de los alumnos en un examen.

load examgrades
x = grades(:,1);

Pruebe la hipótesis nula de que los datos de la muestra proceden de una distribución normal al nivel de significación del 1%.

[h,p] = lillietest(x,'Alpha',0.01)

h = 
0

p = 
0.0348

El valor devuelto de h = 0 indica que lillietest no rechaza la hipótesis nula al nivel de significación del 1%.

Prueba de la distribución exponencial

Abrir script en vivo

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución exponencial en las diferentes marcas de coches.

load carbig
h = lillietest(MPG,'Distribution','exponential')

h = 
1

El valor devuelto de h = 1 indica que lillietest rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Prueba de la distribución de Weibull

Abrir script en vivo

Genere dos conjuntos de datos de muestra, uno a partir de una distribución de Weibull y otro a partir de una distribución lognormal. Efectúe la prueba de Lilliefors para evaluar si cada conjunto de datos procede de una distribución de Weibull. Confirme la decisión de la prueba realizando una comparación visual utilizando una gráfica de probabilidad de Weibull (wblplot).

Genere muestras a partir de una distribución de Weibull.

rng('default')
data1 = wblrnd(0.5,2,[500,1]);

Realice la prueba de Lilliefors utilizando lillietest. Para probar si los datos tienen una distribución de Weibull, pruebe si el logaritmo de los datos tiene una distribución de valores extremos.

h1 = lillietest(log(data1),'Distribution','extreme value')

h1 = 
0

El valor devuelto de h1 = 0 indica que lillietest no rechaza la hipótesis nula al nivel de significación predeterminado del 5%. Confirme la decisión de la prueba mediante una gráfica de probabilidad de Weibull.

wblplot(data1)

Figure contains an axes object. The axes object with title Weibull Probability Plot, xlabel Data, ylabel Probability contains 3 objects of type line. One or more of the lines displays its values using only markers

La gráfica indica que los datos siguen una distribución de Weibull.

Genere muestras a partir de una distribución lognormal.

data2 =lognrnd(5,2,[500,1]);

Realice la prueba de Lilliefors.

h2 = lillietest(log(data2),'Distribution','extreme value')

h2 = 
1

El valor devuelto de h2 = 1 indica que lillietest rechaza la hipótesis nula al nivel de significación predeterminado del 5%. Confirme la decisión de la prueba mediante una gráfica de probabilidad de Weibull.

wblplot(data2)

La gráfica indica que los datos no siguen una distribución de Weibull.

Determinar el valor de p utilizando la aproximación de Montecarlo

Abrir script en vivo

Cargue los datos de muestra. Pruebe la hipótesis nula de que el consumo de combustible de un coche, en millas por galón (MPG), sigue una distribución normal en las diferentes marcas de coches. Determine el valor de $p$ utilizando una aproximación de Montecarlo con un error estándar máximo de Montecarlo de 1e-4.

load carbig
[h,p] = lillietest(MPG,'MCTol',1e-4)

h = 
1

p = 
8.3333e-06

El valor devuelto de h = 1 indica que lillietest rechaza la hipótesis nula de que los datos proceden de una distribución normal al nivel de significación del 5%.

Argumentos de entrada

contraer todo

`x` — Datos de muestra
vector

Datos de muestra, especificados como un vector.

Tipos de datos: single | double

Argumentos de par nombre-valor

contraer todo

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Distribution','exponential','Alpha',0.01 pone a prueba la hipótesis nula de que la distribución de la población pertenece a la familia de distribuciones exponenciales al nivel de significación del 1%.

`Alpha` — Nivel de significación
`0.05` (predeterminado) | valor de escalar en el rango (0,1)

Nivel de significación de la prueba de hipótesis, especificado como el par separado por comas que consta de 'Alpha' y un valor de escalar en el rango (0,1).

Si no se utiliza MCTol, Alpha debe estar en el rango [0.001,0.50].
Si se utiliza MCTol, Alpha debe estar en el rango (0,1).

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

`Distribution` — Familia de distribuciones
`'normal'` (predeterminado) | `'exponential'` | `'extreme value'`

Familia de distribuciones para la prueba de hipótesis, especificada como el par separado por comas que consta de 'Distr' y uno de las siguientes.

`'normal'`	Distribución normal
`'exponential'`	Distribución exponencial
`'extreme value'`	Distribución de valores extremos

Para probar si x tiene una distribución lognormal, pruebe si log(x) tiene una distribución normal.
Para probar si x tiene una distribución de Weibull, pruebe si log(x) tiene una distribución de valores extremos.

Ejemplo: 'Distribution','exponential'

`MCTol` — Error estándar máximo de Montecarlo
valor de escalar en el rango (0,1)

Error estándar máximo de Montecarlo para p, el valor p de la prueba, especificado como el par separado por comas que consta de 'MCTol' y un valor escalar en el rango (0,1).

Ejemplo: 'MCTol',0.001

Tipos de datos: single | double

Argumentos de salida

contraer todo

`h` — Resultado de la prueba de hipótesis
`1` | `0`

Resultado de la prueba de hipótesis, devuelto como 1 o 0.

Un valor de 1 indica el rechazo de la hipótesis nula al nivel de significación Alpha.
Un valor de 0 indica que no se puede rechazar la hipótesis nula al nivel de significación Alpha.

`p` — Valor p
valor de escalar en el rango (0,1)

Valor p de la prueba, devuelto como un valor de escalar en el rango (0,1). p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. Los valores pequeños de p ponen en duda la validez de la hipótesis nula.

Si no se utiliza MCTol, p se calcula mediante interpolación inversa en la tabla de valores críticos y se devuelve como un valor escalar en el rango [0.001,0.50]. lillietest avisa cuando p no se encuentra dentro del rango tabulado y devuelve el valor tabulado más pequeño o el más grande.
Si se utiliza MCTol, lillietest realiza una simulación de Montecarlo para calcular un valor de p más preciso, y p se devuelve como un valor de escalar en el rango (0,1).

`kstat` — Estadística de prueba
valor de escalar no negativo

Estadística de prueba, devuelta como un valor de escalar no negativo.

`critval` — Valor crítico
valor de escalar no negativo

Valor crítico para la prueba de hipótesis, devuelto como valor escalar no negativo.

Más acerca de

contraer todo

Prueba de Lilliefors

La prueba de Lilliefors es una prueba bilateral de bondad de ajuste adecuada cuando se desconocen los parámetros de la distribución nula y deben estimarse. Esto contrasta con la prueba de Kolmogorov-Smirnov de una muestra, que requiere que la distribución nula esté completamente especificada.

La estadística de prueba de Lilliefors es:

$D^{*} = \max_{x} | \hat{F} (x) - G (x) |,$

donde $\hat{F} (x)$ es la cdf empírica de los datos de la muestra y $G (x)$ es la cdf de la distribución hipotética con parámetros estimados iguales a los parámetros de la muestra.

Se puede utilizar lillietest para probar si el vector de datos x tiene una distribución lognormal o de Weibull aplicando una transformación al vector de datos y ejecutando la prueba de Lilliefors adecuada:

Para probar si x tiene una distribución lognormal, pruebe si log(x) tiene una distribución normal.
Para probar si x tiene una distribución de Weibull, pruebe si log(x) tiene una distribución de valores extremos.

La prueba de Lilliefors no puede utilizarse cuando la hipótesis nula no es una familia de distribuciones de localización y escala.

Error estándar de Montecarlo

El error estándar de Montecarlo es el error debido a la simulación del valor p.

El error estándar de Montecarlo se calcula como

$S E = \sqrt{\frac{(\hat{p}) (1 - \hat{p})}{mcreps}},$

donde $\hat{p}$ es el valor de p estimado de la prueba de hipótesis y mcreps es el número de réplicas de Montecarlo realizadas.

El número de réplicas de Montecarlo, mcreps, se determina de forma que el error estándar de Montecarlo para $\hat{p}$ sea inferior al valor especificado para MCTol.

Algoritmos

Para calcular el valor crítico de la prueba de hipótesis, lillietest interpola en una tabla de valores críticos precalculados utilizando la simulación de Montecarlo para tamaños de muestra inferiores a 1000 y niveles de significación entre 0,001 y 0,50. La tabla utilizada por lillietest es mayor y más precisa que la tabla introducida originalmente por Lilliefors. Si se desea un valor de p más exacto o si el nivel de significación deseado es inferior a 0,001 o superior a 0,50, puede utilizarse el argumento de entrada MCTol para ejecutar una simulación de Montecarlo y calcular el valor de p con mayor exactitud.

Cuando el valor calculado de la estadística de prueba es mayor que el valor crítico, lillietest rechaza la hipótesis nula al nivel de significación Alpha.

lillietest trata los valores NaN de x como valores faltantes y los ignora.

Referencias

[1] Conover, W. J. Practical Nonparametric Statistics. Hoboken, NJ: John Wiley & Sons, Inc., 1980.

[2] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown.” Journal of the American Statistical Association. Vol. 64, 1969, pp. 387–389.

[3] Lilliefors, H. W. “On the Kolmogorov-Smirnov test for normality with mean and variance unknown.” Journal of the American Statistical Association. Vol. 62, 1967, pp. 399–402.

Historial de versiones

Introducido antes de R2006a

Consulte también

jbtest | kstest | kstest2 | cdfplot | adtest

lillietest

Sintaxis

Descripción

Ejemplos

Prueba de la distribución normal

Probar la hipótesis con distintos niveles de significación

Prueba de la distribución exponencial

Prueba de la distribución de Weibull

Determinar el valor de p utilizando la aproximación de Montecarlo

Argumentos de entrada

x — Datos de muestra vector

Argumentos de par nombre-valor

Alpha — Nivel de significación 0.05 (predeterminado) | valor de escalar en el rango (0,1)

Distribution — Familia de distribuciones 'normal' (predeterminado) | 'exponential' | 'extreme value'

MCTol — Error estándar máximo de Montecarlo valor de escalar en el rango (0,1)

Argumentos de salida

h — Resultado de la prueba de hipótesis 1 | 0

p — Valor p valor de escalar en el rango (0,1)

kstat — Estadística de prueba valor de escalar no negativo

critval — Valor crítico valor de escalar no negativo

Más acerca de

Prueba de Lilliefors

Error estándar de Montecarlo

Algoritmos

Referencias

Historial de versiones

Consulte también

`x` — Datos de muestra
vector

`Alpha` — Nivel de significación
`0.05` (predeterminado) | valor de escalar en el rango (0,1)

`Distribution` — Familia de distribuciones
`'normal'` (predeterminado) | `'exponential'` | `'extreme value'`

`MCTol` — Error estándar máximo de Montecarlo
valor de escalar en el rango (0,1)

`h` — Resultado de la prueba de hipótesis
`1` | `0`

`p` — Valor p
valor de escalar en el rango (0,1)

`kstat` — Estadística de prueba
valor de escalar no negativo

`critval` — Valor crítico
valor de escalar no negativo