Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Regularice la regresión de Poisson

En este ejemplo se muestra cómo identificar y quitar predictores redundantes de un modelo lineal generalizado.

Crear datos con 20 predictores, y respuestas de Poisson utilizando sólo tres de los predictores, además de una constante.

rng('default') % for reproducibility X = randn(100,20); mu = exp(X(:,[5 10 15])*[.4;.2;.3] + 1); y = poissrnd(mu);

Construya una regularización de lazo validada de forma cruzada de un modelo de regresión de Poisson de los datos.

[B,FitInfo] = lassoglm(X,y,'poisson','CV',10);

Examine la gráfica de validación cruzada para ver el efecto del parámetro de regularización.Lambda

lassoPlot(B,FitInfo,'plottype','CV');     legend('show') % show legend

El círculo verde y la línea discontinua localizan el error de validación cruzada mínimo.Lambda El círculo azul y la línea discontinua localizan el punto con un error de validación cruzada mínimo más una desviación estándar.

Busque los coeficientes de modelo distintos de cero correspondientes a los dos puntos identificados.

minpts = find(B(:,FitInfo.IndexMinDeviance))
minpts = 7×1

     3
     5
     6
    10
    11
    15
    16

min1pts = find(B(:,FitInfo.Index1SE))
min1pts = 3×1

     5
    10
    15

Los coeficientes del punto de error estándar mínimo más uno son exactamente los coeficientes utilizados para crear los datos.

Encuentre los valores de los coeficientes del modelo en el punto de error mínimo más un estándar.

B(min1pts,FitInfo.Index1SE)
ans = 3×1

    0.2903
    0.0789
    0.2081

Los valores de los coeficientes son, como se esperaba, más pequeños que el original.[0.4,0.2,0.3] Lasso funciona mediante "contracción", que Sesge los coeficientes predictores hacia cero.

El término constante está en el vector.FitInfo.Intercept

FitInfo.Intercept(FitInfo.Index1SE)
ans = 1.0879 

El término constante está cerca de 1, que es el valor utilizado para generar los datos.