Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Parcelas de distribución

evaluar visualmente la distribución de los datos de muestra comparando la distribución empírica de los datos con los valores teóricos esperados de una distribución especificada.Distribution plots Utilice trazados de distribución además de pruebas de hipótesis más formales para determinar si los datos de ejemplo proceden de una distribución especificada. Para obtener información sobre las pruebas de hipótesis, consulte.Pruebas de hipótesis

ofrece varias opciones de trazado de distribución:Statistics and Machine Learning Toolbox™

Gráficas de probabilidad normales

Utilice trazados de probabilidad normales para evaluar si los datos proceden de una distribución normal. Muchos procedimientos estadísticos presuponen que una distribución subyacente es normal. Las gráficas de probabilidad normales pueden proporcionar cierta certeza para justificar esta suposición o proporcionar una advertencia de problemas con la suposición. Un análisis de normalidad normalmente combina parcelas de probabilidad normales con pruebas de hipótesis para la normalidad.

Este ejemplo genera una muestra de datos de 25 números aleatorios de una distribución normal con la media 10 y la desviación estándar 1, y crea una gráfica de probabilidad normal de los datos.

rng('default');  % For reproducibility x = normrnd(10,1,[25,1]); normplot(x)

Los signos más trazan la probabilidad empírica frente al valor de datos para cada punto de los datos. Una línea sólida conecta los percentiles 25 y 75 en los datos, y una línea discontinua la extiende hasta los extremos de los datos. Los valores de eje son probabilidades de cero a uno, pero la escala no es lineal.y La distancia entre las marcas de graduación en el eje coincide con la distancia entre los cuantiles de una distribución normal.y Los cuantiles se unen cerca de la mediana (percentil 50) y se extienden simétricamente a medida que se aleja de la mediana.

En una gráfica de probabilidad normal, si todos los puntos de datos caen cerca de la línea, una suposición de normalidad es razonable. De lo contrario, una suposición de normalidad no está justificada. Por ejemplo, lo siguiente genera una muestra de datos de 100 números aleatorios de una distribución exponencial con la media 10, y crea una gráfica de probabilidad normal de los datos.

x = exprnd(10,100,1); normplot(x)

La trama es una fuerte evidencia de que la distribución subyacente no es normal.

Gráficas de probabilidad

Una gráfica de probabilidad, como la gráfica de probabilidad normal, es solo una gráfica CDF empírica escalada a una distribución particular. Los valores de eje son probabilidades de cero a uno, pero la escala no es lineal.y La distancia entre las marcas de graduación es la distancia entre los cuantiles de la distribución. En la gráfica, se dibuja una línea entre el primer y el tercer Cuarte de los datos. Si los datos caen cerca de la línea, es razonable elegir la distribución como un modelo para los datos. Un análisis de distribución suele combinar trazados de probabilidad con pruebas de hipótesis para una distribución determinada.

Crear gráfica de probabilidad de Weibull

Genere datos de ejemplo y cree una gráfica de probabilidad.

Genere datos de ejemplo. El ejemplo contiene 500 números aleatorios de una distribución de Weibull con parámetros de escala y parámetro de forma.x1A = 3B = 3 El ejemplo contiene 500 números aleatorios de una distribución de Rayleigh con parámetro de escala.x2B = 3

rng('default');  % For reproducibility x1 = wblrnd(3,3,[500,1]); x2 = raylrnd(3,[500,1]);

Cree una gráfica de probabilidad para evaluar si los datos se encuentran en una distribución de Weibull y proceden de ella.x1x2

figure probplot('weibull',[x1 x2]) legend('Weibull Sample','Rayleigh Sample','Location','best')

La gráfica de probabilidad muestra que los datos provienen de una distribución de Weibull, mientras que los datos en no.x1x2

Alternativamente, puede usar para crear una gráfica de probabilidad de Weibull.wblplot

Las parcelas Quantile-quantile

Utilice los trazados Quantile-Quantile (q-q) para determinar si dos muestras proceden de la misma familia de distribución. Los trazados q-Q son parcelas de dispersión de cuantiles calculados a partir de cada muestra, con una línea trazada entre el primer y el tercer CUARTE. Si los datos caen cerca de la línea, es razonable suponer que las dos muestras proceden de la misma distribución. El método es robusto con respecto a los cambios en la ubicación y la escala de cualquiera de las distribuciones.

Cree una gráfica cuantil-cuantil utilizando la función.qqplot

El ejemplo siguiente genera dos muestras de datos que contienen números aleatorios de distribuciones de Poisson con valores de parámetro diferentes y crea un trazado cuantil-cuantil. Los datos de es de una distribución de Poisson con la media 10, y los datos en es de una distribución de Poisson con media 5.xy

x = poissrnd(10,[50,1]); y = poissrnd(5,[100,1]); qqplot(x,y)

Aunque los parámetros y tamaños de la muestra son diferentes, la relación lineal aproximada sugiere que las dos muestras pueden venir de la misma familia de distribución. Al igual que con las gráficas de probabilidad normales, las pruebas de hipótesis pueden proporcionar una justificación adicional para tal suposición. Sin embargo, para los procedimientos estadísticos que dependen de las dos muestras procedentes de la misma distribución, una gráfica de cuantil-cuantil lineal suele ser suficiente.

En el ejemplo siguiente se muestra lo que sucede cuando las distribuciones subyacentes no son iguales. Aquí, contiene 100 números aleatorios generados a partir de una distribución normal con media 5 y la desviación estándar 1, mientras que contiene 100 números aleatorios generados a partir de una distribución de Weibull con un parámetro de escala de 2 y un parámetro de forma de 0,5.xy

x = normrnd(5,1,[100,1]); y = wblrnd(2,0.5,[100,1]); qqplot(x,y)

Las parcelas indican que estas muestras claramente no son de la misma familia de distribución.

Parcelas de distribución acumulativas

Una gráfica de función de distribución acumulativa (CDF) empírica muestra la proporción de datos menor o igual que cada valor, en función de.xx La escala en el eje es lineal; en particular, no se escala a ninguna distribución en particular.y Las gráficas CDF empíricas se utilizan para comparar CDFs de datos con CDFS para distribuciones particulares.

Para crear una gráfica CDF empírica, utilice la función o la función.cdfplotecdf

Compare CDF empírico con el CDF teórico

Trace el CDF empírico de un conjunto de datos de muestra y compárelo con el CDF teórico de la distribución subyacente del conjunto de datos de muestra. En la práctica, una CDF teórica puede ser desconocida.

Genere un conjunto de datos de muestra aleatorio a partir de la distribución del valor extremo con un parámetro de ubicación de 0 y un parámetro de escala de 3.

rng('default')  % For reproducibility y = evrnd(0,3,100,1);

Trazar la CDF empírica del conjunto de datos de muestra y la CDF teórica en la misma figura.

cdfplot(y) hold on x = linspace(min(y),max(y)); plot(x,evcdf(x,0,3)) legend('Empirical CDF','Theoretical CDF','Location','best') hold off

La trama muestra la similitud entre la CDF empírica y la CDF teórica.

Alternativamente, puede utilizar la función.ecdf La función también traza los intervalos de confianza del 95% estimados por el uso de la fórmula de Greenwood.ecdf Para obtener más información, consulte.La fórmula de Greenwood

ecdf(y,'Bounds','on') hold on plot(x,evcdf(x,0,3)) grid on title('Empirical CDF') legend('Empirical CDF','Lower Confidence Bound','Upper Confidence Bound','Theoretical CDF','Location','best') hold off

Consulte también

| | | | |

Temas relacionados