Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mle

Estimaciones de máxima verosimilitud

Descripción

phat = mle(data) devuelve estimaciones de máxima verosimilitud (MLEs) para los parámetros de una distribución normal, utilizando los datos de muestra en el vector.data

ejemplo

phat = mle(data,'distribution',dist) devuelve estimaciones de parámetros para una distribución especificada por .dist

ejemplo

phat = mle(data,'pdf',pdf,'start',start) devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad.pdf También debe especificar los valores de parámetro iniciales, .start

ejemplo

phat = mle(data,'pdf',pdf,'start',start,'cdf',cdf) devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad y la función de distribución acumulativa personalizada.pdfcdf

phat = mle(data,'logpdf',logpdf,'start',start) devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad de registro.logpdf También debe especificar los valores de parámetro iniciales, .start

ejemplo

phat = mle(data,'logpdf',logpdf,'start',start,'logsf',logsf) devuelve estimaciones de parámetros para una distribución personalizada especificada por la función de densidad de probabilidad de registro y el registro personalizado.logpdffunción de supervivencialogsf

ejemplo

phat = mle(data,'nloglf',nloglf,'start',start) devuelve estimaciones de parámetros para la distribución personalizada especificada por la función loglikelihood negativa.nloglf También debe especificar los valores de parámetro iniciales, .start

phat = mle(___,Name,Value) especifica las opciones mediante argumentos de par nombre-valor además de cualquiera de los argumentos de entrada en sintaxis anteriores. Por ejemplo, puede especificar los datos censurados, la frecuencia de las observaciones y el nivel de confianza.

ejemplo

[phat,pci] = mle(___) también devuelve los intervalos de confianza del 95% para los parámetros.

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carbig

La variable tiene las millas por galón para diferentes modelos de coches.MPG

Dibuje un histograma de datos.MPG

 histogram(MPG)

La distribución es algo correcta sesgada. Una distribución simétrica, como la distribución normal, podría no ser un buen ajuste.

Estimar los parámetros de la distribución Burr Tipo XII para los datos.MPG

phat = mle(MPG,'distribution','burr')
phat = 1×3

   34.6447    3.7898    3.5722

La máxima probabilidad de estimaciones para el parámetro de escala es 34.6447. Las estimaciones de los dos parámetros de forma

<math display="block">
<mrow>
<mi>c</mi>
</mrow>
</math>
Y
<math display="block">
<mrow>
<mi>k</mi>
</mrow>
</math>
de la distribución Burr Tipo XII son 3.7898 y 3.5722, respectivamente.

Genere datos de muestra de tamaño 1000 a partir de una distribución chi-cuadrada no central con grados de libertad 8 y parámetro de no centralidad 3.

rng default % for reproducibility x = ncx2rnd(8,3,1000,1);

Calcule los parámetros de la distribución chi-cuadrada no central a partir de los datos de muestra. Para ello, defina de forma personalizada el pdf chi-cuadrado no central mediante el argumento de entrada.pdf

[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,d),'start',[1,1])
phat = 1×2

    8.1052    2.6693

pci = 2×2

    7.1121    1.6025
    9.0983    3.7362

La estimación de los grados de libertad es 8.1052 y el parámetro de no centralidad es 2.6693. El intervalo de confianza del 95% para los grados de libertad es (7.1121,9.0983) y el parámetro de no centralidad es (1.6025,3.7362). Los intervalos de confianza incluyen los valores de parámetro verdaderos de 8 y 3, respectivamente.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen , que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime El vector de columna tiene la información de censura para cada paciente, donde 1 indica una observación censurada, y 0 indica que se observa el tiempo exacto de readmisión.Censored Se trata de datos simulados.

Defina una densidad de probabilidad personalizada y una función de distribución acumulativa.

custpdf = @(data,lambda) lambda*exp(-lambda*data); custcdf = @(data,lambda) 1-exp(-lambda*data);

Calcule el parámetro, , de la distribución personalizada para los datos de muestra censurados.lambda

phat = mle(ReadmissionTime,'pdf',custpdf,'cdf',custcdf,'start',0.05,'Censoring',Censored)
phat = 0.1096 

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen , que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime El vector de columna tiene la información de censura para cada paciente, donde 1 indica una observación censurada, y 0 indica que se observa el tiempo exacto de readmisión.Censored Se trata de datos simulados.

Defina una densidad de probabilidad de registro personalizada y una función de supervivencia.

custlogpdf = @(data,lambda,k) log(k)-k*log(lambda)+(k-1)*log(data)-(data/lambda).^k; custlogsf = @(data,lambda,k) -(data/lambda).^k;

Calcule los parámetros y , de la distribución personalizada para los datos de muestra censurados.lambdak

phat = mle(ReadmissionTime,'logpdf',custlogpdf,'logsf',custlogsf,...     'start',[1,0.75],'Censoring',Censored)
phat = 1×2

    9.2090    1.4223

Los parámetros de escala y forma de la distribución definida a medida son 9.2090 y 1.4223, respectivamente.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','readmissiontimes.mat'));

Los datos incluyen , que tiene tiempos de readmisión para 100 pacientes.ReadmissionTime Se trata de datos simulados.

Defina una función de probabilidad de registro negativa.

custnloglf = @(lambda,data,cens,freq) - length(data)*log(lambda) + nansum(lambda*data);

Estimar los parámetros de la distribución definida.

phat = mle(ReadmissionTime,'nloglf',custnloglf,'start',0.05)
phat = 0.1462 

Generar 100 observaciones aleatorias a partir de una distribución binomial con el número de ensayos,

<math display="block">
<mrow>
<mi>n</mi>
</mrow>
</math>
20, y la probabilidad de éxito,
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
0,75.

data = binornd(20,0.75,100,1);

Calcule la probabilidad de éxito y los límites de confianza del 95% utilizando los datos de muestra simulados.

[phat,pci] = mle(data,'distribution','binomial','alpha',.05,'ntrials',20)
phat = 0.7615 
pci = 2×1

    0.7422
    0.7800

La estimación de probabilidad de éxito es 0,7615 y los límites inferior y superior del intervalo de confianza del 95% son 0,7422 y 0,78. Este intervalo cubre el valor verdadero utilizado para simular los datos.

Genere datos de muestra de tamaño 1000 a partir de una distribución chi-cuadrada no central con grados de libertad 10 y parámetro de no centralidad 5.

rng default % for reproducibility x = ncx2rnd(10,5,1000,1);

Supongamos que el parámetro de no centralidad se fija en el valor 5. Estimar los grados de libertad de la distribución chi-cuadrada no central a partir de los datos de la muestra. Para ello, defina de forma personalizada el pdf chi-cuadrado no central mediante el argumento de entrada.pdf

[phat,pci] = mle(x,'pdf',@(x,v,d)ncx2pdf(x,v,5),'start',1)
phat = 9.9307 
pci = 2×1

    9.5626
   10.2989

La estimación para el parámetro de no centralidad es 9.9307, con un intervalo de confianza del 95% de 9.5626 y 10.2989. El intervalo de confianza incluye el valor de parámetro true de 10.

Genere datos de muestra de tamaño 1000 a partir de una distribución Rician con parámetro de no centralidad de 8 y parámetro de escala de 5. Primero cree la distribución Rician.

r = makedist('Rician','s',8,'sigma',5);

Ahora, genere datos de muestra a partir de la distribución que creó anteriormente.

rng default % For reproducibility x = random(r,1000,1);

Supongamos que se conoce el parámetro scale y estime el parámetro de no centralidad a partir de los datos de muestra. Para ello mediante , debe definir a medida la función de densidad de probabilidad de Rician.mle

[phat,pci] = mle(x,'pdf',@(x,s,sigma) pdf('rician',x,s,5),'start',10)
phat = 7.8953 
pci = 2×1

    7.5405
    8.2501

La estimación para el parámetro de no centralidad es 7.8953, con un intervalo de confianza del 95% de 7.5404 y 8.2501. El intervalo de confianza incluye el valor de parámetro verdadero de 8.

Agregue un parámetro de escala a la distribución chi-cuadrada para adaptarse a la escala de datos y ajustarla. En primer lugar, genere datos de muestra de tamaño 1000 a partir de una distribución chi-cuadrada con grados de libertad 5, y escálelo por el factor de 100.

rng default % For reproducibility x = 100*chi2rnd(5,1000,1);

Estimar los grados de libertad y el factor de escala. Para ello, defina de forma personalizada la función de densidad de probabilidad chi-cuadrada utilizando el argumento de entrada.pdf La función de densidad requiere una

<math display="block">
<mrow>
<mn>1</mn>
<mo>/</mo>
<mi>s</mi>
</mrow>
</math>
factor de datos escalados por
<math display="block">
<mrow>
<mi>s</mi>
</mrow>
</math>
.

[phat,pci] = mle(x,'pdf',@(x,v,s)chi2pdf(x/s,v)/s,'start',[1,200])
phat = 1×2

    5.1079   99.1681

pci = 2×2

    4.6862   90.1215
    5.5297  108.2146

La estimación de los grados de libertad es de 5.1079 y la escala es 99.1681. El intervalo de confianza del 95% para los grados de libertad es (4.6862,5.5279) y el parámetro de escala es (90.1215,108.2146). Los intervalos de confianza incluyen los valores de parámetro verdaderos de 5 y 100, respectivamente.

Argumentos de entrada

contraer todo

Los datos de ejemplo se utilizan para estimar los parámetros de distribución, especificados como vector.mle

Tipos de datos: single | double

Tipo de distribución para el que se deben estimar los parámetros, especificados como uno de los siguientes.

distDescripciónParámetro 1Parámetro 2Parámetro 3Parámetro 4
'Bernoulli'Bernoulli Distribution: probabilidad de éxito para cada ensayop
'Beta'Beta Distribution: primer parámetro de formaa: segundo parámetro de formab
O'bino''Binomial'Binomial Distribution: número de ensayosn: probabilidad de éxito para cada ensayop
'BirnbaumSaunders'Birnbaum-Saunders Distribution: parámetro de escalaβ: parámetro de formaγ
'Burr'Burr Type XII Distribution: parámetro de escala: primer parámetro de formac: segundo parámetro de formak
O'Discrete Uniform''unid'Uniform Distribution (Discrete): valor máximo observablen
O'exp''Exponential'Exponential Distribution: mediaμ
O'ev''Extreme Value'Extreme Value Distribution: parámetro de ubicaciónμ: parámetro de escalaσ
O'gam''Gamma'Gamma Distribution: parámetro de formaa: parámetro de escalab
O'gev''Generalized Extreme Value'Generalized Extreme Value Distribution: parámetro de formak: parámetro de escalaσ: parámetro de ubicaciónμ
O'gp''Generalized Pareto'Generalized Pareto Distribution: parámetro de índice de cola (forma)k: parámetro de escalaσ: umbral (ubicación) parámetroθ
O'geo''Geometric'Geometric Distribution: parámetro de probabilidadp
O'hn''Half Normal'Half-Normal Distribution: parámetro de ubicaciónμ: parámetro de escalaσ
'InverseGaussian'Inverse Gaussian Distribution: parámetro de escalaμ: parámetro de formaλ
'Logistic'Logistic Distribution: mediaμ : parámetro de escalaσ
'LogLogistic'Loglogistic Distribution: media de valores logarítmicosμ: parámetro de escala de los valores logarítmicosσ
O'logn''LogNormal'Distribución Lognormal: media de valores logarítmicosμ: desviación estándar de los valores logarítmicosσ
'Nakagami'Nakagami Distribution: parámetro de formaμ: parámetro de escalaω
O'nbin''Negative Binomial'Negative Binomial Distribution: número de éxitosr: probabilidad de éxito en un solo ensayop
O'norm''Normal'Distribución normal: mediaμ : desviación estándarσ
O'poiss''Poisson'Distribución de Poisson: mediaλ
O'rayl''Rayleigh'Rayleigh Distribution: parámetro de escalab
'Rician'Rician Distribution: parámetro de no centralidads: parámetro de escalaσ
'Stable'Stable Distribution: primer parámetro de formaα: segundo parámetro de formaβ: parámetro de escalaγ: parámetro de ubicaciónδ
'tLocationScale't Location-Scale Distribution: parámetro de ubicaciónμ: parámetro de escalaσ: parámetro de formaν
O'unif''Uniform'Uniform Distribution (Continuous): punto final inferior (mínimo)a: punto final superior (máximo)b
O'wbl''Weibull'Weibull Distribution: parámetro de escalaa: parámetro de formab

Ejemplo: 'rician'

Función de distribución de probabilidad personalizada, especificada como un identificador de función creado mediante .@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de densidad de probabilidad.data

Por ejemplo, si el nombre de la función de densidad de probabilidad personalizada es , puede especificar el identificador de función de la siguiente manera.newpdfmle

Ejemplo: @newpdf

Tipos de datos: function_handle

Función de distribución acumulativa personalizada, especificada como un identificador de función creado mediante .@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad acumulativa.data

Debe definir con si los datos están censurados y utiliza el argumento de par nombre-valor.cdfpdf'Censoring' Si no está presente, no es necesario especificar durante el uso de .'Censoring'cdfpdf

Por ejemplo, si el nombre de la función de distribución acumulativa personalizada es , puede especificar el identificador de función de la siguiente manera.newcdfmle

Ejemplo: @newcdf

Tipos de datos: function_handle

Función de densidad de probabilidad de registro personalizada, especificada como un identificador de función creado mediante .@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad de registro.data

Por ejemplo, si el nombre de la función de densidad de probabilidad de registro personalizado es , puede especificar el identificador de función de la siguiente manera.customlogpdfmle

Ejemplo: @customlogpdf

Tipos de datos: function_handle

Registro personalizado , especificado como un identificador de función creado mediante .función de supervivencia@

Esta función personalizada acepta el vector y uno o más parámetros de distribución individuales como parámetros de entrada y devuelve un vector de valores de probabilidad de supervivencia de registro.data

Debe definir con si los datos están censurados y utiliza el argumento de par nombre-valor.logsflogpdf'Censoring' Si no está presente, no es necesario especificar durante el uso de .'Censoring'logsflogpdf

Por ejemplo, si el nombre de la función de supervivencia de registro personalizada es , puede especificar el identificador de función de la siguiente manera.logsurvivalmle

Ejemplo: @logsurvival

Tipos de datos: function_handle

Función de probabilidad de registro negativa personalizada, especificada como un identificador de función creado mediante .@

Esta función personalizada acepta los siguientes argumentos de entrada.

paramsVector de valores de parámetros de distribución. detecta el número de parámetros a partir del número de elementos en .mlestart
dataVector de datos.
censVector booleano de valores censurados.
freqVector de frecuencias de datos enteros.

debe aceptar los cuatro argumentos incluso si no utiliza los argumentos de par nombre-valor.nloglf'Censoring''Frequency' Puede escribir para ignorar y argumentos en ese caso.'nloglf'censfreq

devuelve un valor de loglikelihood negativo escalar y, opcionalmente, un vector de gradiente de probabilidad de registro negativo (consulte el campo en ).nloglf'GradObj''Options'

Si el nombre de la función de probabilidad de registro negativo personalizada es , puede especificar el identificador de función de la siguiente manera.negloglikmle

Ejemplo: @negloglik

Tipos de datos: function_handle

Valores de parámetro iniciales para las funciones personalizadas, especificados como un valor escalar o un vector de valores escalares.

Utilícelo cuando se ajusten a distribuciones personalizadas, es decir, cuando utilice argumentos y , y , o de entrada.startpdfcdflogpdflogsfnloglf

Ejemplo: 0.05

Ejemplo: [100,2]

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: especifica que estima los parámetros para la distribución de los datos censurados especificados por la matriz, calcula los límites de confianza del 99% para las estimaciones de parámetros y utiliza los parámetros de control de algoritmo especificados por la estructura.'Censoring',Cens,'Alpha',0.01,'Options',OptmleCensOpt

Indicador de censura, especificado como el par separado por comas que consta de y una matriz booleana del mismo tamaño que .'Censoring'data Utilice 1 para las observaciones que están censuradas correctamente y 0 para las observaciones que se observan completamente. El valor predeterminado es que todas las observaciones se observan completamente.

Por ejemplo, si la información de datos censurada se encuentra en la matriz binaria llamada , puede especificar los datos censurados de la siguiente manera.Censored

Ejemplo: 'Censoring',Censored

apoya la censura para las siguientes distribuciones:mle

Birnbaum-Saunders Burr Valor Extremo Exponencial Gamma Inverso Gaussiano Kernel Log-Logistic






Logística Lognormal Nakagami Normal Rician t Escala de Ubicación Weibull





Tipos de datos: logical

Frecuencia de observaciones, especificada como el par separado por comas que consta de y una matriz que contiene recuentos enteros no negativos, que tiene el mismo tamaño que .'Frequency'data El valor predeterminado es una observación por elemento de .data

Por ejemplo, si las frecuencias de observación se almacenan en una matriz denominada , puede especificar las frecuencias de la siguiente manera.Freq

Ejemplo: 'Frequency',Freq

Tipos de datos: single | double

Nivel de significancia para el intervalo de confianza de las estimaciones de parámetros, , especificado como el par separado por comas que consta de y un valor escalar en el intervalo (0,1).pci'Alpha' El nivel de confianza de es % .pci100(1-Alpha) El valor predeterminado es para la confianza del 95%.0.05

Por ejemplo, para los límites de confianza del 99%, puede especificar el nivel de confianza de la siguiente manera.

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Número de ensayos para el elemento correspondiente de , especificado como el par separado por comas que consta de un escalar o un vector del mismo tamaño que .data'Ntrials'data

Solo se aplica a la distribución binomial.

Ejemplo: 'Ntrials',total

Tipos de datos: single | double

Parámetro de ubicación para la distribución seminormal, especificado como el par separado por comas que consta de y un valor escalar.'mu'

Solo se aplica a la distribución seminormal.

Ejemplo: 'mu',1

Tipos de datos: single | double

Parámetros de control de algoritmo de ajuste, especificados como el par separado por comas que consta de y una estructura devuelta por .'Options'statset

No aplicable a todas las distribuciones.

Utilice el argumento de par nombre-valor para controlar los detalles de la optimización de máxima verosimilitud al ajustar una distribución personalizada.'Options' Para los nombres de parámetro y los valores predeterminados, escriba .statset('mlecustom') Puede establecer las opciones con un nuevo nombre y usarlo en el argumento de par nombre-valor. interpreta los siguientes parámetros para el ajuste de distribución personalizado.mlestatset

ParámetroValor
'GradObj'

El valor predeterminado es .'off'

o , indicando si puede esperar o no que la función personalizada proporcionada con el argumento de entrada devuelva el vector de degradado de la probabilidad de registro negativa como una segunda salida.'on''off'fminconnloglf

ignora cuando se utiliza .mle'GradObj'fminsearch

'DerivStep'

El valor predeterminado es .eps^(1/3)

La diferencia relativa, especificada como un escalar o un vector del mismo tamaño que , utilizado en aproximaciones derivadas de diferencias finitas cuando se utiliza , y es .startfmincon'GradObj''off'

ignora cuando se utiliza .mle'DerivStep'fminsearch

'FunValCheck'

El valor predeterminado es .'on'

o , indicando si debe comprobar o no la validez de los valores devueltos por las funciones de distribución personalizadas.'on''off'mle

Una mala elección del punto de partida a veces puede hacer que estas funciones devuelvan s, valores infinitos o valores fuera de rango si se escriben sin la comprobación de errores adecuada.NaN

'TolBnd'

El valor predeterminado es .1e-6

Un desplazamiento para los límites inferior y superior cuando se utiliza .fmincon

trata los límites inferior y superior como desigualdades estrictas, es decir, límites abiertos.mle Con , esto se aproxima mediante la creación de límites cerrados inset a partir de los límites inferior y superior especificados por .fminconTolBnd

Ejemplo: 'Options',statset('mlecustom')

Tipos de datos: struct

Límites inferiores para los parámetros de distribución, especificados como el par separado por comas que consta de y un vector del mismo tamaño que .'Lowerbound'start

Este argumento de par nombre-valor solo es válido cuando se utilizan los argumentos y , y , o de entrada.pdfcdflogpdflogcdfnloglf

Ejemplo: 'Lowerbound',0

Tipos de datos: single | double

Límites superiores para los parámetros de distribución, especificados como el par separado por comas que consta de y un vector del mismo tamaño que .'Upperbound'start

Este argumento de par nombre-valor solo es válido cuando se utilizan los argumentos y , y , o de entrada.pdfcdflogpdflogsfnloglf

Ejemplo: 'Upperbound',1

Tipos de datos: single | double

La función de optimización se utiliza para maximizar la probabilidad, especificada como el par separado por comas que consta de y uno o .mle'Optimfun''fminsearch''fmincon'

El valor predeterminado es .'fminsearch'

Solo puede especificar si está disponible.'fmincon'Optimization Toolbox™

El argumento de par nombre-valor solo es válido cuando se ajustan distribuciones personalizadas, es decir, cuando se utilizan los argumentos y , y , o de entrada.'Optimfun'pdfcdflogpdflogsfnloglf

Ejemplo: 'Optimfun','fmincon'

Argumentos de salida

contraer todo

Estimaciones de parámetros, devueltas como un valor escalar o un vector de fila.

Intervalos de confianza para estimaciones de parámetros, devueltos como vector de columna o matriz en función del número de parámetros, de ahí el tamaño de .phat

es una matriz de 2 por, donde está el número de estimaciones de parámetros.pcikkmle La primera y la segunda filas del programa muestran los límites de confianza inferior y superior, respectivamente.pci

Más acerca de

contraer todo

Función de supervivencia

La función de supervivencia es la probabilidad de supervivencia en función del tiempo. También se llama la función de supervivencia. Da la probabilidad de que el tiempo de supervivencia de un individuo exceda un cierto valor. Dado que la función de distribución acumulativa, ( ), es la probabilidad de que el tiempo de supervivencia sea menor o igual que un punto dado en el tiempo, la función de supervivencia para una distribución continua, ( ), es el complemento de la función de distribución acumulativa: ( ) a 1 – ( ).FtStStFt

Sugerencias

Al proporcionar funciones de distribución, calcula las estimaciones de parámetros mediante un algoritmo de maximización iterativa.mle Con algunos modelos y datos, una mala elección del punto de partida puede hacer que converjan a un óptimo local que no es el maximizador global, o no converger por completo.mle Incluso en los casos para los que la probabilidad de registro se comporta bien cerca del máximo global, la elección del punto de partida suele ser crucial para la convergencia del algoritmo. En particular, si los valores de parámetro iniciales están lejos de los MLEs, el subdesbordamiento en las funciones de distribución puede dar lugar a infinitas probabilidades de registro.

Introducido antes de R2006a