Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Distribución normal

Visión general

La distribución normal, a veces llamada distribución gaussiana, es una familia de curvas de dos parámetros. La justificación habitual para utilizar la distribución normal para el modelado es el teorema de Límite Central, que indica (aproximadamente) que la suma de muestras independientes de cualquier distribución con media finita y varianza converge a la distribución normal como la muestra tamaño va al infinito.

ofrece varias formas de trabajar con la distribución normal.Statistics and Machine Learning Toolbox™

  • Cree un objeto de distribución de probabilidad ajustando una distribución de probabilidad a los datos de muestra ( ) o especificando valores de parámetro ( ).NormalDistributionfitdistmakedist A continuación, utilice funciones de objeto para evaluar la distribución, generar números aleatorios, etc.

  • Trabaje con la distribución normal de forma interactiva mediante la aplicación.Creador Fitter Puede exportar un objeto desde la aplicación y utilizar las funciones de objeto.

  • Utilice funciones específicas de distribución ( , , , , , , , , ) con parámetros de distribución especificados.normcdfnormpdfnorminvnormlikenormstatnormfitnormrnd Las funciones específicas de la distribución pueden aceptar parámetros de varias distribuciones normales.

  • Utilice funciones de distribución genéricas ( , , , ) con un nombre de distribución especificado ( ) y parámetros.cdficdfpdfrandom'Normal'

Parámetros

La distribución normal utiliza estos parámetros.

ParámetroDescripciónApoyo
mu (μ)Decir<μ<
sigma (σ)Desviación estándarσ0

La distribución normal estándar tiene cero media y desviación estándar unitaria. Si es normal estándar, entonces + también es normal con la media y la desviación estándar.zσzµµσ Por el contrario, si es normal con la media y la desviación estándar, entonces el número ( – ) / es normal estándar.xµσzxµσ

Estimación de parámetros

Los (MLE) son las estimaciones de parámetros que maximizan la función de probabilidad.estimaciones de máxima verosimilitud Los estimadores de máxima verosimilitud de μ Y σ2 para la distribución normal, respectivamente, son

x¯=i=1nxin

Y

sMLE2=1ni=1n(xix¯)2.

x¯ es la media de la muestra para las muestras x1, x2, …, xn. La media de la muestra es un estimador imparcial del parámetro μ. Sin embargo s2MLE es un estimador sesgado del parámetro σ2, lo que significa que su valor esperado no es igual al parámetro.

El (MVUE) se utiliza comúnmente para estimar los parámetros de la distribución normal.mínima varianza unestimado-sesgado El MVUE es el estimador que tiene la varianza mínima de todos los estimadores imparciales de un parámetro. Las MVUEs de los parámetros μ Y σ2 para la distribución normal son la media de la muestra y varianza de la muestra s2Respectivamente.

s2=1n1i=1n(xix¯)2

Para ajustar la distribución normal a los datos y encontrar las estimaciones de parámetros, utilice , , o .normfitfitdistmle

  • Para los datos sin censura, y encontrar las estimaciones imparciales, y encuentra las estimaciones de máxima probabilidad.normfitfitdistmle

  • Para los datos censurados, , , y encontrar las estimaciones de máxima probabilidad.normfitfitdistmle

A diferencia de y , que devuelven estimaciones de parámetros, devuelve el objeto de distribución de probabilidad ajustado.normfitmlefitdistNormalDistribution El objeto propiedades y almacenar las estimaciones de parámetros.musigma

Para obtener un ejemplo, consulte .Ajustar objeto de distribución normal

Función de densidad de probabilidad

La función de densidad de probabilidad normal (pdf) es

y=f(x|μ,σ)=1σ2πe(xμ)22σ2,forx.

Es el pdf visto como una función de los parámetros.función de probabilidad Las estimaciones de máxima verosimilitud (MLEs) son las estimaciones de parámetros que maximizan la función de probabilidad para los valores fijos de .x

Para obtener un ejemplo, consulte .Calcular y trazar la distribución normal pdf

Función de distribución acumulativa

La función de distribución acumulativa normal (cdf) es

p=F(x|μ,σ)=1σ2πxe(tμ)22σ2dt,forx.

p es la probabilidad de que una sola observación de una distribución normal con parámetros μ Y σ cae en el intervalo (-∞,x].

La función de distribución acumulativa normal estándar Φ(x) está funcionalmente relacionado con la función de error .erf

Φ(x)=12(1erf(x2))

Dónde

erf(x)=2π0xedt2t=2Φ(2x)1.

Para ver un ejemplo, véaseTrazar distribución normal estándar cdf

Ejemplos

Ajustar objeto de distribución normal

Cargue los datos de muestra y cree un vector que contenga la primera columna de datos de calificación de exámenes de alumnos.

load examgrades x = grades(:,1);

Cree un objeto de distribución normal acondicionándolo a los datos.

pd = fitdist(x,'Normal')
pd =    NormalDistribution    Normal distribution        mu = 75.0083   [73.4321, 76.5846]     sigma =  8.7202   [7.7391, 9.98843]  

Los intervalos junto a las estimaciones de parámetros son los intervalos de confianza del 95% para los parámetros de distribución.

Calcular y trazar la distribución normal pdf

Calcular el pdf de una distribución normal estándar, con parámetros

<math display="block">
<mrow>
<mi>μ</mi>
</mrow>
</math>
igual a 0 y
<math display="block">
<mrow>
<mi>σ</mi>
</mrow>
</math>
igual a 1.

x = [-3:.1:3]; y = normpdf(x,0,1);

Trazar el pdf.

plot(x,y)

Trazar distribución normal estándar cdf

Cree un objeto de distribución normal estándar.

pd = makedist('Normal')
pd =    NormalDistribution    Normal distribution        mu = 0     sigma = 1  

Especifique los valores y calcule el cdf.x

x = -3:.1:3; p = cdf(pd,x);

Trazar el cdf de la distribución normal estándar.

plot(x,p)

Comparar pdf gamma y distribución normal

La distribución gamma tiene el parámetro shape

<math>
<mi mathvariant="italic">a</mi>
</math>
y el parámetro de escala
<math>
<mi mathvariant="italic">b</mi>
</math>
. Para una gran
<math>
<mi mathvariant="italic">a</mi>
</math>
, la distribución gamma se aproxima estrechamente a la distribución normal con
<math display="inline">
<mrow>
<mi>μ</mi>
<mo>=</mo>
<mi mathvariant="italic">ab</mi>
</mrow>
</math>
y varianza
<math display="inline">
<mrow>
<msup>
<mrow>
<mi>σ</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msup>
<mo>=</mo>
<mi mathvariant="italic">a</mi>
<msup>
<mrow>
<mi mathvariant="italic">b</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msup>
</mrow>
</math>
. Calcular el pdf de una distribución gamma con parámetros y .A = 100B = 10 Para la comparación, también calcule el pdf de una distribución normal con parámetros y .mu = 1000sigma = 100

x = gaminv((0.005:0.01:0.995),100,10); y_gam = gampdf(x,100,10); y_norm = normpdf(x,1000,100);

Trazar los pdf de la distribución gamma y la distribución normal en la misma figura.

plot(x,y_gam,'-',x,y_norm,'-.') title('Gamma and Normal pdfs') legend('Gamma Distribution','Normal Distribution')

Relación entre distribuciones normales y lognormales

Si sigue la distribución lognormal con parámetros y, a continuación, log( ) sigue la distribución normal con media y desviación estándar.XµσXµσ Utilice objetos de distribución para inspeccionar la relación entre las distribuciones normales y lognormales.

Cree un objeto de distribución lognormal especificando los valores de parámetro.

pd = makedist('Lognormal','mu',5,'sigma',2)
pd =    LognormalDistribution    Lognormal distribution        mu = 5     sigma = 2  

Calcular la media de la distribución lognormal.

mean(pd)
ans = 1.0966e+03 

La media de la distribución lognormal no es igual al parámetro.mu La media de los valores logarítmicos es igual a .mu Confirme esta relación generando números aleatorios.

Genere números aleatorios a partir de la distribución lognormal y calcule sus valores de registro.

rng('default');  % For reproducibility x = random(pd,10000,1); logx = log(x);

Calcular la media de los valores logarítmicos.

m = mean(logx)
m = 5.0033 

La media del registro de está cerca del parámetro de , porque tiene una distribución lognormal.xmuxx

Construya un histograma con un ajuste de distribución normal.logx

histfit(logx)

El trazado muestra que los valores de registro de se distribuyen normalmente.x

se utiliza para ajustar una distribución a los datos.histfitfitdist Se utiliza para obtener los parámetros utilizados en el empalme.fitdist

pd_normal = fitdist(logx,'Normal')
pd_normal =    NormalDistribution    Normal distribution        mu = 5.00332   [4.96445, 5.04219]     sigma = 1.98296   [1.95585, 2.01083]  

Los parámetros de distribución normal estimados están cerca de los parámetros de distribución lognormal 5 y 2.

Comparar pdf de estudiante y distribución normalt

La distribución del estudiante es una familia de curvas dependiendo de un único parámetro (los grados de libertad).tν A medida que los grados de libertad van hasta el infinito, la distribución se acerca a la distribución normal estándar.νt Calcular los pdfs para la distribución del estudiante con el parámetro y la distribución del estudiante con el parámetro .tnu = 5tnu = 25 Calcular el pdf para una distribución normal estándar.

x = -5:0.1:5; y1 = tpdf(x,5); y2 = tpdf(x,15); z = normpdf(x,0,1);

Trazar los pdf del estudiante y el pdf normal estándar en la misma figura.t El pdf normal estándar tiene colas más cortas que los pdf del estudiante.t

plot(x,y1,'-.',x,y2,'--',x,z,'-') legend('Student''s t Distribution with \nu=5', ...     'Student''s t Distribution with \nu=25', ...     'Standard Normal Distribution','Location','best') title('Student''s t and Standard Normal pdfs')

Distribuciones relacionadas

  • — La distribución binomial modela el número total de éxitos en ensayos repetidos con la probabilidad de éxito.Binomial Distributionnp A medida que aumenta, la distribución binomial puede ser aproximada por una distribución normal conn µ = np Y σ2 = np(1–p).

  • — Si tiene una distribución Birnbaum-Saunders con parámetros y ,Birnbaum-Saunders Distributionxβγ

    (xββx)γ

    tiene una distribución normal estándar.

  • — La distribución chi-cuadrada es la distribución de la suma de variables aleatorias normales cuadradas, independientes y estándar.Chi-Square Distribution Si un conjunto de observaciones se distribuye normalmente con varianzanσ2Ys2 es la varianza de la muestra, entonces (n–1)s2/σ2 tiene una distribución chi-cuadrada con n–1 grados de libertad. La función utiliza esta relación para calcular los intervalos de confianza para la estimación del parámetro normalnormfitσ2 .

  • — La distribución del valor extremo es adecuada para modelar el valor más pequeño o más grande de una distribución cuyas colas se descomponen exponencialmente rápidamente, como la distribución normal.Extreme Value Distribution

  • — La distribución gamma tiene el parámetro shape y el scale.Gamma Distributionab Para un gran, la distribución gamma se aproxima estrechamente a la distribución normal cona μ = ab y varianza σ2 = ab2. La distribución gamma tiene densidad sólo para números reales positivos. Ver.Comparar pdf gamma y distribución normal

  • — La distribución seminormal es un caso especial de las distribuciones normales plegadas y truncadas normales.Half-Normal Distribution Si una variable aleatoria tiene una distribución normal estándar, entoncesZ X=μ+σ|Z| tiene una distribución medio normal con parámetros y .μσ

  • — La distribución logística se utiliza para modelos de crecimiento y en regresión logística.Logistic Distribution Tiene colas más largas y una curtosis más alta que la distribución normal.

  • — Si sigue la distribución lognormal con parámetros y , log( ) sigue la distribución normal con la media y la desviación estándar.Distribución LognormalXµσXµσ Ver.Relación entre distribuciones normales y lognormales

  • — La distribución normal multivariante es una generalización de la normal univariada a dos o más variables.Distribución normal multivariante Es una distribución para vectores aleatorios de variables correlacionadas, en la que cada elemento tiene una distribución normal univariada. En el caso más simple, no hay correlación entre las variables, y los elementos de los vectores son variables aleatorias normales independientes y univariadas.

  • — La distribución de Poisson es una distribución discreta de un parámetro que toma valores enteros no negativos.Distribución de Poisson El parámetro , , es tanto la media como la varianza de la distribución.λ A medida que aumenta, la distribución de Poisson puede aproximarse mediante una distribución normal conλ µ = λ Y σ2 = λ.

  • — La distribución de Rayleigh es un caso especial de la distribución de Weibull con aplicaciones en teoría de las comunicaciones.Rayleigh Distribution Si las velocidades de componente de una partícula en las direcciones y son dos variables aleatorias normales independientes con medios cero e varianzas iguales, la distancia que la partícula viaja por unidad de tiempo sigue la distribución de Rayleigh.xy

  • — La distribución normal es un caso especial de la distribución estable.Stable Distribution La distribución estable con el primer parámetro de forma α = 2 corresponde a la distribución normal.

    N(μ,σ2)=S(2,0,σ2,μ).

  • — La distribución del estudiante es una familia de curvas dependiendo de un único parámetro (los grados de libertad).Student's t Distributiontν A medida que los grados de libertad van hasta el infinito, la distribución se acerca a la distribución normal estándar.νt Ver.Comparar pdf de estudiante y distribución normalt

    Si es una muestra aleatoria de tamaño de una distribución normal con media, entonces la estadísticaxnμ

    t=x¯μs/n

    Dónde x¯ es la media de la muestra y es la desviación estándar de la muestra, tiene la distribución del estudiante const n–1 grados de libertad.

  • — La distribución de escala de ubicación es útil para modelar distribuciones de datos con colas más pesadas (más propensas a valores atípicos) que la distribución normal.t Location-Scale Distributiont Se acerca a la distribución normal a medida que el parámetro de forma se acerca al infinito.ν

Referencias

[1] Abramowitz, M., and I. A. Stegun. Handbook of Mathematical Functions. New York: Dover, 1964.

[2] Evans, M., N. Hastings, and B. Peacock. Statistical Distributions. 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc., 1993.

[3] Lawless, J. F. Statistical Models and Methods for Lifetime Data. Hoboken, NJ: Wiley-Interscience, 1982.

[4] Marsaglia, G., and W. W. Tsang. “A Fast, Easily Implemented Method for Sampling from Decreasing or Symmetric Unimodal Density Functions.” SIAM Journal on Scientific and Statistical Computing. Vol. 5, Number 2, 1984, pp. 349–359.

[5] Meeker, W. Q., and L. A. Escobar. Statistical Methods for Reliability Data. Hoboken, NJ: John Wiley & Sons, Inc., 1998.

Consulte también

| | | | | | | |

Temas relacionados