Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Distribución normal

Visión general

La distribución normal, a veces llamada la distribución gaussiana, es una familia de curvas de dos parámetros. La justificación habitual para utilizar la distribución normal para el modelado es el teorema de límite central, que indica (más o menos) que la suma de muestras independientes de cualquier distribución con media finita y varianza converge a la distribución normal como la muestra tamaño va al infinito.

ofrece varias formas de trabajar con la distribución normal.Statistics and Machine Learning Toolbox™

  • Cree un objeto de distribución de probabilidad mediante la adaptación de una distribución de probabilidad a datos de ejemplo () o especificando valores de parámetro ().NormalDistributionfitdistmakedist A continuación, utilice las funciones de objeto para evaluar la distribución, generar números aleatorios, etcétera.

  • Trabaje con la distribución normal de forma interactiva mediante la aplicación.Distribución Fitter Puede exportar un objeto de la aplicación y utilizar las funciones del objeto.

  • Utilice funciones específicas de la distribución (,,,,,,) con parámetros de distribución especificados.normcdfnormpdfnorminvnormlikenormstatnormfitnormrnd Las funciones específicas de la distribución pueden aceptar parámetros de varias distribuciones normales.

  • Utilice funciones de distribución genéricas (,,,) con un nombre de distribución especificado () y parámetros.cdficdfpdfAleatorio'Normal'

Parámetros

La distribución normal utiliza estos parámetros.

ParámetroDescripciónApoyo
(muμ)Decir<μ<
(sigmaσ)La desviación estándarσ0

La distribución normal estándar tiene la media cero y la desviación estándar de la unidad. Si es normal estándar, entonces + es también normal con la media y la desviación estándar.zσzµµσ Por el contrario, si es normal con la media y la desviación estándar, entonces = (–)/es normal estándar.xµσzxµσ

Estimación de parámetros

Los (MLEs) son las estimaciones de parámetros que maximizan la función de probabilidad.maximum likelihood estimates Los estimadores de máxima probabilidad de μ Y σ2 para la distribución normal, respectivamente, son

x¯=i=1nxin

Y

sMLE2=1ni=1n(xix¯)2.

x¯ es la media de muestra para muestras x1, x2, …, xn. La media de la muestra es un estimador imparcial del parámetro μ. Sin embargo s2MLE es un estimador sesgado del parámetro σ2, lo que significa que su valor esperado no es igual al parámetro.

El (MVUE) se utiliza comúnmente para estimar los parámetros de la distribución normal.minimum variance unbiased estimator El MVUE es el estimador que tiene la varianza mínima de todos los estimadores imparciales de un parámetro. Los MVUEs de los parámetros μ Y σ2 para la distribución normal son la media de la muestra y la varianza de muestra s2Respectivamente.

s2=1n1i=1n(xix¯)2

Para ajustar la distribución normal a los datos y encontrar las estimaciones de parámetros, utilice, o.normfitfitdistmle

  • Para los datos sin censura, y encontrar las estimaciones imparciales, y encuentra las estimaciones de máxima verosimilitud.normfitfitdistmle

  • Para los datos censurados,,, y encontrar las estimaciones de máxima verosimilitud.normfitfitdistmle

A diferencia de y, que las estimaciones de parámetro de retorno, devuelve el objeto de distribución de probabilidad ajustada.normfitmlefitdistNormalDistribution Las propiedades del objeto y almacenar las estimaciones de parámetros.musigma

Para ver un ejemplo, vea.Ajustar objeto de distribución normal

Función de densidad de probabilidad

La función de densidad de probabilidad normal (pdf) es

y=f(x|μ,σ)=1σ2πe(xμ)22σ2,forx.

El es el pdf visto como una función de los parámetros.likelihood function Las estimaciones de máxima verosimilitud (MLEs) son las estimaciones de parámetros que maximizan la función de probabilidad para valores fijos de.x

Para ver un ejemplo, vea.Calcular y trazar el PDF de distribución normal

Función de distribución acumulativa

La función de distribución acumulativa normal (CDF) es

p=F(x|μ,σ)=1σ2πxe(tμ)22σ2dt,forx.

p es la probabilidad de que una sola observación de una distribución normal con parámetros μ Y σ cae en el intervalo (-∞,x].

La función de distribución acumulativa normal estándar Φ(x) está funcionalmente relacionado con la función de error.erf

Φ(x)=12(1erf(x2))

Dónde

erf(x)=2π0xedt2t=2Φ(2x)1.

Para ver un ejemplo, consulteTrazar distribución normal estándar CDF

Ejemplos

Ajustar objeto de distribución normal

Cargue los datos de ejemplo y cree un vector que contenga la primera columna de datos de grado de examen de estudiante.

load examgrades x = grades(:,1);

Cree un objeto de distribución normal al encajarlo en los datos.

pd = fitdist(x,'Normal')
pd =    NormalDistribution    Normal distribution        mu = 75.0083   [73.4321, 76.5846]     sigma =  8.7202   [7.7391, 9.98843]  

Los intervalos junto a las estimaciones del parámetro son los intervalos de confianza del 95% para los parámetros de distribución.

Calcular y trazar el PDF de distribución normal

Calcule el PDF de una distribución normal estándar, con parámetros

<math display="block">
<mrow>
<mi>μ</mi>
</mrow>
</math>
igual a 0 y
<math display="block">
<mrow>
<mi>σ</mi>
</mrow>
</math>
igual a 1.

x = [-3:.1:3]; y = normpdf(x,0,1);

Trace el pdf.

plot(x,y)

Trazar distribución normal estándar CDF

Cree un objeto de distribución normal estándar.

pd = makedist('Normal')
pd =    NormalDistribution    Normal distribution        mu = 0     sigma = 1  

Especifique los valores y calcule el CDF.x

x = -3:.1:3; p = cdf(pd,x);

Trace la CDF de la distribución normal estándar.

plot(x,p)

Compare los archivos PDF de gamma y distribución normal

La distribución gamma tiene el parámetro de forma

<math>
<mi mathvariant="italic">a</mi>
</math>
y el parámetro de escala
<math>
<mi mathvariant="italic">b</mi>
</math>
. Para una gran
<math>
<mi mathvariant="italic">a</mi>
</math>
, la distribución gamma se aproxima estrechamente a la distribución normal con la media
<math display="inline">
<mrow>
<mi>μ</mi>
<mo>=</mo>
<mi mathvariant="italic">ab</mi>
</mrow>
</math>
y la varianza
<math display="inline">
<mrow>
<msup>
<mrow>
<mi>σ</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msup>
<mo>=</mo>
<mi mathvariant="italic">a</mi>
<msup>
<mrow>
<mi mathvariant="italic">b</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msup>
</mrow>
</math>
. Calcule el PDF de una distribución gamma con parámetros y.A = 100B = 10 Para la comparación, también calcule el PDF de una distribución normal con parámetros y.mu = 1000sigma = 100

x = gaminv((0.005:0.01:0.995),100,10); y_gam = gampdf(x,100,10); y_norm = normpdf(x,1000,100);

Trace los archivos PDF de la distribución gamma y la distribución normal en la misma figura.

plot(x,y_gam,'-',x,y_norm,'-.') title('Gamma and Normal pdfs') legend('Gamma Distribution','Normal Distribution')

Relación entre distribuciones normales y lognormal

Si sigue la distribución lognormal con parámetros y, a continuación, log () sigue la distribución normal con la media y la desviación estándar.XµσXµσ Utilice objetos de distribución para inspeccionar la relación entre distribuciones normales y lognormal.

Cree un objeto de distribución lognormal especificando los valores de los parámetros.

pd = makedist('Lognormal','mu',5,'sigma',2)
pd =    LognormalDistribution    Lognormal distribution        mu = 5     sigma = 2  

Calcule la media de la distribución lognormal.

mean(pd)
ans = 1.0966e+03 

La media de la distribución lognormal no es igual al parámetro.mu La media de los valores logarítmicos es igual a.mu Confirme esta relación generando números aleatorios.

Genere números aleatorios a partir de la distribución lognormal y calcule sus valores de registro.

rng('default');  % For reproducibility x = random(pd,10000,1); logx = log(x);

Calcule la media de los valores logarítmicos.

m = mean(logx)
m = 5.0033 

La media del tronco está cerca del parámetro de, porque tiene una distribución lognormal.xmuxx

Construya un histograma con un ajuste de distribución normal.logx

histfit(logx)

La gráfica muestra que los valores de registro de se distribuyen normalmente.x

utiliza para ajustar una distribución a los datos.histfitfitdist Se utiliza para obtener los parámetros utilizados en el ajuste.fitdist

pd_normal = fitdist(logx,'Normal')
pd_normal =    NormalDistribution    Normal distribution        mu = 5.00332   [4.96445, 5.04219]     sigma = 1.98296   [1.95585, 2.01083]  

Los parámetros de distribución normales estimados están cerca de los parámetros de distribución lognormal 5 y 2.

Comparar PDF de estudiantes y distribución normalt

La distribución del estudiante es una familia de curvas en función de un único parámetro (los grados de libertad).tν A medida que los grados de libertad van al infinito, la distribución se aproxima a la distribución normal estándar.νt Calcule los archivos PDF para la distribución del alumno con el parámetro y la distribución del alumno con el parámetro.tnu = 5tnu = 25 Calcule el PDF para una distribución normal estándar.

x = -5:0.1:5; y1 = tpdf(x,5); y2 = tpdf(x,15); z = normpdf(x,0,1);

Trace los PDF del alumno y el pdf normal estándar en la misma figura.t El pdf estándar normal tiene colas más cortas que los PDF del estudiante.t

plot(x,y1,'-.',x,y2,'--',x,z,'-') legend('Student''s t Distribution with \nu=5', ...     'Student''s t Distribution with \nu=25', ...     'Standard Normal Distribution','Location','best') title('Student''s t and Standard Normal pdfs')

Distribuciones relacionadas

  • — La distribución binomial modela el número total de éxitos en ensayos repetidos con la probabilidad de éxito.Distribución binomialnp A medida que aumenta, la distribución binomial puede aproximarse mediante una distribución normal conn µ = np Y σ2 = np(1–p).

  • — Si tiene una distribución Birnbaum-Saunders con parámetros y, a continuación,Birnbaum-Saunders Distributionxβγ

    (xββx)γ

    tiene una distribución normal estándar.

  • — La distribución de Chi-cuadrada es la distribución de la suma de las variables aleatorias normales estándar cuadradas, independientes.Distribución de Chi-cuadrado Si un conjunto de observaciones se distribuye normalmente con varianzanσ2Ys2 es la varianza de la muestra, (n–1)s2/σ2 tiene una distribución de Chi-cuadrada con n–1 grados de libertad. La función utiliza esta relación para calcular los intervalos de confianza para la estimación del parámetro normalnormfitσ2 .

  • — La distribución del valor extremo es adecuada para modelar el valor más pequeño o más grande de una distribución cuyas colas decaen exponencialmente rápidamente, como la distribución normal.Distribución de valor extremo

  • — La distribución gamma tiene el parámetro Shape y el parámetro scale.Distribución gammaab Para un tamaño grande, la distribución gamma se aproxima estrechamente a la distribución normal con la mediaa μ = ab y la varianza σ2 = ab2. La distribución gamma tiene densidad sólo para números reales positivos. Ver.Compare los archivos PDF de gamma y distribución normal

  • — La distribución seminormal es un caso especial de las distribuciones normales dobladas normales y truncadas.Distribución media-normal Si una variable aleatoria tiene una distribución normal estándar,Z X=μ+σ|Z| tiene una distribución media-normal con parámetros y.μσ

  • — La distribución logística se utiliza para los modelos de crecimiento y en la regresión logística.Distribución logística Tiene colas más largas y una mayor curtosis que la distribución normal.

  • — Si sigue la distribución lognormal con parámetros y, a continuación, log () sigue la distribución normal con la media y la desviación estándar.Distribución LognormalXµσXµσ Ver.Relación entre distribuciones normales y lognormal

  • — La distribución normal multivariada es una generalización de la normal univariada a dos o más variables.Distribución normal multivariada Es una distribución para vectores aleatorios de variables correlacionadas, en las que cada elemento tiene una distribución normal univariada. En el caso más simple, no hay correlación entre las variables, y los elementos de los vectores son independientes, variables aleatorias normales univariadas.

  • — La distribución de Poisson es una distribución discreta de un parámetro que toma valores enteros no negativos.Distribución de Poisson El parámetro,, es tanto la media como la varianza de la distribución.λ Como aumento, la distribución de Poisson se puede aproximar mediante una distribución normal conλ µ = λ Y σ2 = λ.

  • — La distribución de Rayleigh es un caso especial de la distribución de Weibull con aplicaciones en la teoría de las comunicaciones.Rayleigh Distribution Si las velocidades de los componentes de una partícula en las instrucciones y las direcciones son dos variables aleatorias normales independientes con medias cero y varianzas iguales, la distancia a la que viaja la partícula por unidad de tiempo sigue la distribución de Rayleigh.xy

  • — La distribución normal es un caso especial de la distribución estable.Distribución estable La distribución estable con el primer parámetro de forma α = 2 corresponde a la distribución normal.

    N(μ,σ2)=S(2,0,σ2,μ).

  • — La distribución del estudiante es una familia de curvas en función de un único parámetro (los grados de libertad).Student ' t Distributiontν A medida que los grados de libertad van al infinito, la distribución se aproxima a la distribución normal estándar.νt Ver.Comparar PDF de estudiantes y distribución normalt

    Si se trata de una muestra aleatoria de tamaño de una distribución normal con media, la estadísticaxnμ

    t=x¯μs/n

    Dónde x¯ es la media de la muestra y es la desviación estándar de la muestra, tiene la distribución del estudiante const n–1 grados de libertad.

  • — La distribución a escala de ubicación es útil para modelar distribuciones de datos con colas más pesadas (más propensas a valores atípicos) que la distribución normal.t distribución de escala de ubicaciónt Se aproxima a la distribución normal a medida que el parámetro de forma se aproxima al infinito.ν

Referencias

[1] Abramowitz, M., and I. A. Stegun. Handbook of Mathematical Functions. New York: Dover, 1964.

[2] Evans, M., N. Hastings, and B. Peacock. Statistical Distributions. 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc., 1993.

[3] Lawless, J. F. Statistical Models and Methods for Lifetime Data. Hoboken, NJ: Wiley-Interscience, 1982.

[4] Marsaglia, G., and W. W. Tsang. “A Fast, Easily Implemented Method for Sampling from Decreasing or Symmetric Unimodal Density Functions.” SIAM Journal on Scientific and Statistical Computing. Vol. 5, Number 2, 1984, pp. 349–359.

[5] Meeker, W. Q., and L. A. Escobar. Statistical Methods for Reliability Data. Hoboken, NJ: John Wiley & Sons, Inc., 1998.

Consulte también

| | | | | | | |

Temas relacionados