Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mle

Estimaciones de máxima verosimilitud

Descripción

phat = mle(data) Devuelve estimaciones de máxima verosimilitud (MLEs) para los parámetros de una distribución normal, utilizando los datos de muestra en el vector.data

ejemplo

phat = mle(data,'distribution',dist) Devuelve estimaciones de parámetros para una distribución especificada por.dist

ejemplo

phat = mle(data,'pdf',pdf,'start',start) Devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad.pdf También debe especificar los valores de los parámetros iniciales,.start

ejemplo

phat = mle(data,'pdf',pdf,'start',start,'cdf',cdf) Devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad y la función de distribución acumulativa personalizada.pdfcdf

phat = mle(data,'logpdf',logpdf,'start',start) Devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad de registro.logpdf También debe especificar los valores de los parámetros iniciales,.start

ejemplo

phat = mle(data,'logpdf',logpdf,'start',start,'logsf',logsf) Devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad de registro y el registro personalizado.logpdffunción de supervivencialogsf

ejemplo

phat = mle(data,'nloglf',nloglf,'start',start) Devuelve estimaciones de parámetros para la distribución personalizada especificada por la función de logverosimilitud negativa.nloglf También debe especificar los valores de los parámetros iniciales,.start

phat = mle(___,Name,Value) especifica opciones utilizando argumentos de par nombre-valor además de cualquiera de los argumentos de entrada en sintaxis anteriores. Por ejemplo, puede especificar los datos censurados, la frecuencia de las observaciones y el nivel de confianza.

ejemplo

[phat,pci] = mle(___) también devuelve los intervalos de confianza de 95% para los parámetros.

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carbig

La variable tiene las millas por galón para diferentes modelos de coches.MPG

Dibuje un histograma de datos.MPG

 histogram(MPG)

La distribución es un poco sesgada derecha. Una distribución simétrica, como la distribución normal, podría no ser una buena opción.

Estime los parámetros de la distribución Burr Type XII para los datos.MPG

phat = mle(MPG,'distribution','burr')
phat = 1×3

   34.6447    3.7898    3.5722

Las estimaciones de máxima verosimilitud para el parámetro de escala α es 34,6447. Las estimaciones para los dos parámetros de forma

<math display="block">
<mrow>
<mi>c</mi>
</mrow>
</math>
Y
<math display="block">
<mrow>
<mi>k</mi>
</mrow>
</math>
de la distribución Burr tipo XII son 3,7898 y 3,5722, respectivamente.

Genere datos de muestra de tamaño 1000 desde una distribución Chi-cuadrada no central con grados de libertad 8 y parámetro de no centralidad 3.

rng default % for reproducibility x = ncx2rnd(8,3,1000,1);

Calcule los parámetros de la distribución Chi-cuadrada no central a partir de los datos de muestra. Para ello, defina el PDF no central de Chi-cuadrado utilizando el argumento de entrada.pdf

[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,d),'start',[1,1])
phat = 1×2

    8.1052    2.6693

pci = 2×2

    7.1121    1.6025
    9.0983    3.7362

La estimación de los grados de libertad es 8,1052 y el parámetro de no centralidad es 2,6693. El intervalo de confianza de 95% para los grados de libertad es (7.1121, 9.0983) y el parámetro de no centralidad es (1.6025, 3.7362). Los intervalos de confianza incluyen los valores de parámetro verdaderos de 8 y 3, respectivamente.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen, que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime El vector de columna tiene la información de censura para cada paciente, donde 1 indica una observación censurada, y 0 indica que se observa el tiempo exacto de readmisión.Censored Se trata de datos simulados.

Defina una densidad de probabilidad personalizada y una función de distribución acumulativa.

custpdf = @(data,lambda) lambda*exp(-lambda*data); custcdf = @(data,lambda) 1-exp(-lambda*data);

Estime el parámetro, de la distribución personalizada para los datos de muestra censurados.lambda

phat = mle(ReadmissionTime,'pdf',custpdf,'cdf',custcdf,'start',0.05,'Censoring',Censored)
phat = 0.1096 

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen, que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime El vector de columna tiene la información de censura para cada paciente, donde 1 indica una observación censurada, y 0 indica que se observa el tiempo exacto de readmisión.Censored Se trata de datos simulados.

Definir una densidad de probabilidad de registro personalizada y la función de supervivencia.

custlogpdf = @(data,lambda,k) log(k)-k*log(lambda)+(k-1)*log(data)-(data/lambda).^k; custlogsf = @(data,lambda,k) -(data/lambda).^k;

Estime los parámetros y, de la distribución personalizada para los datos de muestra censurados.lambdak

phat = mle(ReadmissionTime,'logpdf',custlogpdf,'logsf',custlogsf,...     'start',[1,0.75],'Censoring',Censored)
phat = 1×2

    9.2090    1.4223

Los parámetros de escala y forma de la distribución definida por el personalizado son 9,2090 y 1,4223, respectivamente.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen, que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime Se trata de datos simulados.

Defina una función de probabilidad logaritmo negativa.

custnloglf = @(lambda,data,cens,freq) - length(data)*log(lambda) + nansum(lambda*data);

Estimar los parámetros de la distribución definida.

phat = mle(ReadmissionTime,'nloglf',custnloglf,'start',0.05)
phat = 0.1462 

Generar 100 observaciones aleatorias de una distribución binomial con el número de ensayos,

<math display="block">
<mrow>
<mi>n</mi>
</mrow>
</math>
= 20, y la probabilidad de éxito,
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
= 0,75.

data = binornd(20,0.75,100,1);

Calcule la probabilidad de éxito y los límites de confianza del 95% utilizando los datos de muestra simulados.

[phat,pci] = mle(data,'distribution','binomial','alpha',.05,'ntrials',20)
phat = 0.7615 
pci = 2×1

    0.7422
    0.7800

La estimación de la probabilidad de éxito es 0,7615 y los límites inferior y superior del intervalo de confianza del 95% son 0,7422 y 0,78. Este intervalo cubre el valor verdadero utilizado para simular los datos.

Genere datos de muestra de tamaño 1000 desde una distribución Chi-cuadrada no central con grados de libertad 10 y parámetro de no centralidad 5.

rng default % for reproducibility x = ncx2rnd(10,5,1000,1);

Supongamos que el parámetro de no centralidad se fija en el valor 5. Calcule los grados de libertad de la distribución de Chi-cuadrado no central a partir de los datos de muestra. Para ello, defina el PDF no central de Chi-cuadrado utilizando el argumento de entrada.pdf

[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,5),'start',1)
phat = 9.9307 
pci = 2×1

    9.5626
   10.2989

La estimación para el parámetro de no centralidad es 9,9307, con un intervalo de confianza de 95% de 9,5626 y 10,2989. El intervalo de confianza incluye el valor de parámetro true de 10.

Genere datos de muestra de tamaño 1000 desde una distribución de Rician con parámetro de no centralidad de 8 y parámetro de escala de 5. Primero crear la distribución de Rician.

r = makedist('Rician','s',8,'sigma',5);

Ahora, genere datos de ejemplo de la distribución que creó anteriormente.

rng default % For reproducibility x = random(r,1000,1);

Supongamos que se conoce el parámetro de escala y estimar el parámetro de no centralidad a partir de datos de ejemplo. Para hacer esto usando, debe definir la función de densidad de probabilidad de Rician personalizada.mle

[phat,pci] = mle(x,'pdf',@(x,s,sigma) pdf('rician',x,s,5),'start',10)
phat = 7.8953 
pci = 2×1

    7.5405
    8.2501

La estimación para el parámetro de no centralidad es 7,8953, con un intervalo de confianza de 95% de 7,5404 y 8,2501. El intervalo de confianza incluye el valor de parámetro true de 8.

Agregue un parámetro de escala a la distribución de Chi-cuadrado para adaptarse a la escala de datos y ajustarlo. En primer lugar, genere datos de muestra de tamaño 1000 desde una distribución Chi-cuadrada con grados de libertad 5, y escale por el factor de 100.

rng default % For reproducibility x = 100*chi2rnd(5,1000,1);

Estimar los grados de libertad y el factor de escala. Para ello, defina la función de densidad de probabilidad de Chi-cuadrado utilizando el argumento de entrada.pdf La función de densidad requiere un

<math display="block">
<mrow>
<mn>1</mn>
<mo>/</mo>
<mi>s</mi>
</mrow>
</math>
factor de datos escalado por
<math display="block">
<mrow>
<mi>s</mi>
</mrow>
</math>
.

[phat,pci] = mle(x,'pdf',@(x,v,s)chi2pdf(x/s,v)/s,'start',[1,200])
phat = 1×2

    5.1079   99.1681

pci = 2×2

    4.6862   90.1215
    5.5297  108.2146

La estimación de los grados de libertad es 5,1079 y la escala es 99,1681. El intervalo de confianza de 95% para los grados de libertad es (4.6862, 5.5279) y el parámetro de escala es (90.1215, 108.2146). Los intervalos de confianza incluyen los valores de parámetro verdaderos de 5 y 100, respectivamente.

Argumentos de entrada

contraer todo

Los datos de ejemplo se utilizan para estimar los parámetros de distribución, especificados como un vector.mle

Tipos de datos: single | double

Tipo de distribución para estimar parámetros para, especificado como uno de los siguientes.

distDescripciónParámetro 1Parámetro 2Parámetro 3Parámetro 4
'Bernoulli'La distribución de Bernoulli: probabilidad de éxito de cada ensayop
'Beta'Distribución beta: primer parámetro de formaa: segundo parámetro de formab
O'bino''Binomial'Distribución binomial: número de ensayosn: probabilidad de éxito de cada ensayop
'BirnbaumSaunders'Birnbaum-Saunders Distribution: parámetro de escalaβ: parámetro de formaγ
'Burr'Tipo de Burr XII distribuciónα: parámetro de escala: primer parámetro de formac: segundo parámetro de formak
O'Discrete Uniform''unid'Distribución uniforme (discreta): máximo valor observablen
O'exp''Exponential'Distribución exponencial: significaμ
O'ev''Extreme Value'Distribución de valor extremo: parámetro de ubicaciónμ: parámetro de escalaσ
O'gam''Gamma'Distribución gamma: parámetro de formaa: parámetro de escalab
O'gev''Generalized Extreme Value'Distribución de valor extremo generalizado: parámetro de formak: parámetro de escalaσ: parámetro de ubicaciónμ
O'gp''Generalized Pareto'La distribución generalizada de Pareto: parámetro de índice de cola (forma)k: parámetro de escalaσ: parámetro de umbral (ubicación)θ
O'geo''Geometric'Distribución geométrica: parámetro de probabilidadp
O'hn''Half Normal'Distribución media-normal: parámetro de ubicaciónμ: parámetro de escalaσ
'InverseGaussian'Distribución gaussiana inversa: parámetro de escalaμ: parámetro de formaλ
'Logistic'Distribución logística: significaμ : parámetro de escalaσ
'LogLogistic'La distribución loglogística: media de valores logarítmicosμ: parámetro de escala de valores logarítmicosσ
O'logn''LogNormal'Distribución Lognormal: media de valores logarítmicosμ: desviación estándar de valores logarítmicosσ
'Nakagami'Nakagami Distribution: parámetro de formaμ: parámetro de escalaω
O'nbin''Negative Binomial'Distribución binomial negativa: número de éxitosr: probabilidad de éxito en una sola pruebap
O'norm''Normal'Distribución normal: significaμ : desviación estándarσ
O'poiss''Poisson'Distribución de Poisson: significaλ
O'rayl''Rayleigh'Rayleigh Distribution: parámetro de escalab
'Rician'Distribución de Rician: parámetro de no centralidads: parámetro de escalaσ
'Stable'Distribución estable: primer parámetro de formaα: segundo parámetro de formaβ: parámetro de escalaγ: parámetro de ubicaciónδ
'tLocationScale't distribución de escala de ubicación: parámetro de ubicaciónμ: parámetro de escalaσ: parámetro de formaν
O'unif''Uniform'Distribución uniforme (continua): punto final inferior (mínimo)a: punto final superior (máximo)b
O'wbl''Weibull'La distribución de Weibull: parámetro de escalaa: parámetro de formab

Ejemplo: 'rician'

Función de distribución de probabilidad personalizada, especificada como un identificador de función creado mediante.@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de densidad de probabilidad.data

Por ejemplo, si el nombre de la función de densidad de probabilidad personalizada es, a continuación, puede especificar el identificador de función de la siguiente manera.newpdfmle

Ejemplo: @newpdf

Tipos de datos: function_handle

Función de distribución acumulativa personalizada, especificada como un identificador de función creado mediante.@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad acumulados.data

Debe definir con si los datos están censurados y utiliza el argumento de par nombre-valor.cdfpdf'Censoring' Si no está presente, no tiene que especificar durante el uso.'Censoring'cdfpdf

Por ejemplo, si el nombre de la función de distribución acumulativa personalizada es, a continuación, puede especificar el identificador de función de la siguiente manera.newcdfmle

Ejemplo: @newcdf

Tipos de datos: function_handle

Función de densidad de probabilidad de registro personalizado, especificada como un identificador de función creado mediante.@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad de registro.data

Por ejemplo, si el nombre de la función de densidad de probabilidad de registro personalizada es, a continuación, puede especificar el identificador de función de la siguiente manera.customlogpdfmle

Ejemplo: @customlogpdf

Tipos de datos: function_handle

Registro personalizado, especificado como un identificador de función creado mediante.función de supervivencia@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad de supervivencia de registro.data

Debe definir con si los datos están censurados y utiliza el argumento de par nombre-valor.logsflogpdf'Censoring' Si no está presente, no tiene que especificar durante el uso.'Censoring'logsflogpdf

Por ejemplo, si el nombre de la función de supervivencia del registro personalizado es, a continuación, puede especificar el identificador de función de la siguiente manera.logsurvivalmle

Ejemplo: @logsurvival

Tipos de datos: function_handle

Función de logverosimilitud negativa personalizada, especificada como un identificador de función creado mediante.@

Esta función personalizada acepta los siguientes argumentos de entrada.

paramsVector de valores de parámetros de distribución. detecta el número de parámetros del número de elementos en.mlestart
dataVector de datos.
censVector booleano de valores censurados.
freqVector de frecuencias de datos enteros.

debe aceptar los cuatro argumentos incluso si no usa los argumentos de par nombre-valor o.nloglf'Censoring''Frequency' Puede escribir para ignorar y argumentos en ese caso.'nloglf'censfreq

Devuelve un valor de logverosimilitud negativo escalar y, opcionalmente, un vector de degradado de logverosimilitud negativo (consulte el campo en).nloglf'GradObj''Options'

Si el nombre de la función de verosimilitud de registro negativo personalizado es, puede especificar el identificador de función de la siguiente manera.negloglikmle

Ejemplo: @negloglik

Tipos de datos: function_handle

Valores de parámetro iniciales para las funciones personalizadas, especificadas como un valor escalar o un vector de valores escalares.

Utilíce al ajustar distribuciones personalizadas, es decir, cuando utilice y y, o introduzca argumentos.startpdfcdflogpdflogsfnloglf

Ejemplo: 0,05

Ejemplo: [100,2]

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: Especifica que calcula los parámetros para la distribución de datos censurados especificados por Array, calcula los límites de confianza de 99% para las estimaciones de parámetros y utiliza los parámetros de control de algoritmo especificados por la estructura.'Censoring',Cens,'Alpha',0.01,'Options',OptmleCensOpt

Indicador de censura, especificado como el par separado por comas que consta de y una matriz booleana del mismo tamaño que.'Censoring'data Utilice 1 para las observaciones que están censuradas a la derecha y 0 para las observaciones que se observan completamente. El valor predeterminado es que todas las observaciones se observan completamente.

Por ejemplo, si la información de datos censurado está en la matriz binaria llamada, a continuación, puede especificar los datos censurados de la siguiente manera.Censored

Ejemplo: 'Censoring',Censored

admite la censura de las siguientes distribuciones:mle

Birnbaum-Saunders Burr exponencial de valor extremo gamma inverso gaussiano kernel log-Logistic






Logistic lognormal Nakagami normal Rician t localización-escala Weibull





Tipos de datos: logical

Frecuencia de observaciones, especificada como el par separado por comas que consta de una matriz que contiene recuentos de enteros no negativos, que tiene el mismo tamaño que.'Frequency'data El valor predeterminado es una observación por elemento de.data

Por ejemplo, si las frecuencias de observación se almacenan en una matriz denominada, puede especificar las frecuencias de la siguiente manera.Freq

Ejemplo: 'Frequency',Freq

Tipos de datos: single | double

Nivel de significancia para el intervalo de confianza de las estimaciones de parámetros, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).pci'Alpha' El nivel de confianza es%.pci100(1-Alpha) El valor predeterminado es 95% de confianza.0,05

Por ejemplo, para límites de confianza del 99%, puede especificar el nivel de confianza de la siguiente manera.

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Número de ensayos para el elemento correspondiente de, especificado como el par separado por comas que consta de un escalar o un vector del mismo tamaño que.data'Ntrials'data

Sólo se aplica a la distribución binomial.

Ejemplo: 'Ntrials',total

Tipos de datos: single | double

Parámetro de ubicación para la distribución de media normal, especificado como el par separado por comas que consta de un valor escalar.'mu'

Sólo se aplica a la distribución media-normal.

Ejemplo: 'mu',1

Tipos de datos: single | double

Parámetros de control de algoritmo de ajuste, especificados como el par separado por comas que consta de y una estructura devuelta por.'Options'statset

No aplicable a todas las distribuciones.

Use el argumento de par nombre-valor para controlar los detalles de la optimización de máxima verosimilitud al ajustar una distribución personalizada.'Options' Para los nombres de parámetro y los valores predeterminados, escriba.statset('mlecustom') Puede establecer las opciones con un nuevo nombre y usarla en el argumento de par nombre-valor. interpreta los siguientes parámetros para el ajuste de distribución personalizado.mlestatset

ParámetroValor
'GradObj'

El valor predeterminado es.'off'

o, indicando si puede esperar o no la función personalizada proporcionada con el argumento de entrada para devolver el vector de degradado de la log-verosimilitud negativa como una segunda salida.'on''off'fminconnloglf

ignora cuando se utiliza.mle'GradObj'fminsearch

'DerivStep'

El valor predeterminado es.eps^(1/3)

La diferencia relativa, especificada como un escalar o un vector del mismo tamaño que, utilizado en aproximaciones derivadas de diferencia finita al usar, y es.startfmincon'GradObj''off'

ignora cuando se utiliza.mle'DerivStep'fminsearch

'FunValCheck'

El valor predeterminado es.'on'

o, indicando si debe o no comprobar los valores devueltos por las funciones de distribución personalizada para la validez.'on''off'mle

Una mala elección del punto de partida a veces puede hacer que estas funciones devuelvan s, valores infinitos o valores fuera de rango Si se escriben sin una comprobación de errores adecuada.NaN

'TolBnd'

El valor predeterminado es.1e-6

Un desplazamiento para los límites inferior y superior al usar.fmincon

trata los límites inferiores y superiores como desigualdades estrictas, es decir, límites abiertos.mle Con esto se aproxima mediante la creación de límites cerrados insertados a partir de los límites inferior y superior especificados.fminconTolBnd

Ejemplo: 'Options',statset('mlecustom')

Tipos de datos: struct

Límites inferiores para los parámetros de distribución, especificados como el par separado por comas que consta de un vector del mismo tamaño que.'Lowerbound'start

Este argumento de par nombre-valor es válido sólo cuando se utilizan los argumentos y, y o de entrada.pdfcdflogpdflogcdfnloglf

Ejemplo: 'Lowerbound',0

Tipos de datos: single | double

Límites superiores para los parámetros de distribución, especificados como el par separado por comas que consta de un vector del mismo tamaño que.'Upperbound'start

Este argumento de par nombre-valor es válido sólo cuando se utilizan los argumentos y, y o de entrada.pdfcdflogpdflogsfnloglf

Ejemplo: 'Upperbound',1

Tipos de datos: single | double

La función de optimización utiliza para maximizar la probabilidad, especificada como el par separado por comas que consta de y cualquiera o.mle'Optimfun''fminsearch''fmincon'

El valor predeterminado es.'fminsearch'

Solo puede especificar si está disponible.'fmincon'Optimization Toolbox™

El argumento de par nombre-valor es válido sólo cuando se ajustan las distribuciones personalizadas, es decir, cuando se utilizan los argumentos y, y o de entrada.'Optimfun'pdfcdflogpdflogsfnloglf

Ejemplo: 'Optimfun','fmincon'

Argumentos de salida

contraer todo

Estimaciones de parámetros, devueltas como un valor escalar o un vector de fila.

Intervalos de confianza para las estimaciones de parámetros, devueltos como un vector de columna o una matriz en función del número de parámetros, de ahí el tamaño de.phat

es un 2 por matriz, donde es el número de estimaciones de parámetros.pcikkmle La primera y la segunda fila de la muestra los límites de confianza inferior y superior, respectivamente.pci

Más acerca de

contraer todo

Función de supervivencia

La función de supervivencia es la probabilidad de supervivencia como una función del tiempo. También se llama la función superviviente. Da la probabilidad de que el tiempo de supervivencia de un individuo exceda un cierto valor. Dado que la función de distribución acumulativa, (), es la probabilidad de que el tiempo de supervivencia sea menor o igual a un punto determinado en el tiempo, la función de supervivencia para una distribución continua, (), es el complemento de la función de distribución acumulativa: () = 1 – ().FtStStFt

Sugerencias

Al suministrar funciones de distribución, calcula las estimaciones de parámetros mediante un algoritmo de maximización iterativa.mle Con algunos modelos y datos, una mala elección del punto de partida puede hacer que converjan en un óptimo local que no sea el Maximizador global, o que no se converjan por completo.mle Incluso en los casos para los que el log-verosimilitud se comporta bien cerca del máximo global, la elección del punto de partida es a menudo crucial para la convergencia del algoritmo. En particular, si los valores de parámetro iniciales están lejos de los MLEs, el subdesbordamiento en las funciones de distribución puede llevar a infinito log-las probabilidades.

Introducido antes de R2006a