Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

La notación Wilkinson

Visión general

La notación Wilkinson proporciona una manera de describir los modelos de regresión y medidas repetidas sin especificar valores de coeficiente. Esta notación especializada identifica la variable de respuesta y las variables predictoras que se incluirán o excluirán del modelo. También puede incluir términos de orden cuadrado y superior, términos de interacción y variables de agrupación en la fórmula del modelo.

Especificar un modelo utilizando la notación Wilkinson ofrece varias ventajas:

  • Puede incluir o excluir predictores individuales y términos de interacción del modelo. Por ejemplo, el uso del par nombre-valor disponible en cada función de ajuste de modelo incluye términos de interacción para todos los pares de variables.'Interactions' El uso de la notación Wilkinson en su lugar permite incluir solo los términos de interacción de interés.

  • Puede cambiar la fórmula del modelo sin cambiar la matriz de diseño, si los datos de entrada utilizan el tipo de datos.table Por ejemplo, si ajusta un modelo inicial con todas las variables predictoras disponibles, pero decide eliminar una variable que no es estadísticamente significativa, puede volver a escribir la fórmula del modelo para incluir solo las variables de interés. No es necesario realizar ningún cambio en los datos de entrada propiamente dichos.

ofrece varias funciones de ajuste de modelos que utilizan la notación Wilkinson, incluyendo:Statistics and Machine Learning Toolbox™

  • Modelos lineales (utilizando y)fitlmstepwiselm

  • Modelos lineales generalizados (utilizando)fitglm

  • Modelos lineales de efectos mixtos (utilizando y)fitlmefitlmematrix

  • Modelos lineales generalizados de efectos mixtos (utilizando)fitglme

  • Modelos de medidas repetidas (utilizando)fitrm

Especificación de fórmula

Una fórmula para la especificación del modelo es un vector de caracteres o un escalar de cadena del formulario, donde es el nombre de la variable de respuesta y define el modelo utilizando los nombres de variables predictoras y los siguientes operadores.y ~ termsyterms

Variables predictoras

Términos de predictor en ModelLa notación Wilkinson
Interceptar1
ninguna intercepción–1
x1x1
x1, x2x1 + x2
x1, x2, x1x2Ox1*x2x1 + x2 + x1:x2
x1x2x1:x2
x1, x12x1^2
x12x1^2 – x1

La notación Wilkinson incluye un término de intercepción en el modelo de forma predeterminada, incluso si no agrega 1 a la fórmula del modelo. Para excluir la intercepción del modelo, use-1 en la fórmula.

El operador (para las interacciones) y el operador (para la potencia y los exponentes) incluyen automáticamente todos los términos de orden inferior.*^ Por ejemplo, si especifica, el modelo incluirá automáticamentex^3 x3, x2Y.x Si desea excluir determinadas variables del modelo, utilice el operador para eliminar los términos no deseados.

Los modelos de efectos aleatorios y de efectos mixtos

Para los modelos de efectos aleatorios y de efectos mixtos, la especificación de fórmula incluye los nombres de las variables predictoras y las variables de agrupamiento. Por ejemplo, si la variable predictora x1 es un efecto aleatorio agrupado por la variable, a continuación, representar esto en la notación Wilkinson de la siguiente manera:g

(x1 | g)

Modelos de medidas repetidas

Para los modelos de medidas repetidas, la especificación de fórmula incluye todas las medidas repetidas como respuestas y los factores como variables predictoras. Especifique las variables de respuesta para los modelos de medidas repetidas como se describe en la tabla siguiente.

Términos de respuesta en ModelLa notación Wilkinson
y1y1
y1, y2, y3y1,y2,y3
y1, y2, y3, y4, y5y1–y5

Por ejemplo, si tiene tres medidas repetidas como respuestas y los factores x1, x2Y x3 como las variables predictoras, entonces usted puede definir el modelo de las medidas repetidas usando la notación Wilkinson como sigue:

y1,y2,y3 ~ x1 + x2 + x3

O

y1-y3 ~ x1 + x2 + x3

Los nombres de variable

Si los datos de entrada (variables de respuesta y predictores) se almacenan en una tabla o una matriz de DataSet, puede especificar la fórmula utilizando los nombres de las variables. Por ejemplo, cargue los datos de ejemplo.carsmall Cree una tabla que contenga, y.WeightAccelerationMPG Asigne un nombre a cada variable mediante el argumento de par nombre-valor de la función de empalme.'VariableNames'fitlm A continuación, ajuste el siguiente modelo a los datos:

MPG=β0+β1Weight+β2Acceleration

load carsmall tbl = table(Weight,Acceleration,MPG, ...     'VariableNames',{'Weight','Acceleration','MPG'}); mdl = fitlm(tbl,'MPG ~ Weight + Acceleration')
mdl =    Linear regression model:     MPG ~ 1 + Weight + Acceleration  Estimated Coefficients:                      Estimate         SE         tStat       pValue                       __________    __________    _______    __________      (Intercept)         45.155        3.4659     13.028    1.6266e-22     Weight          -0.0082475    0.00059836    -13.783    5.3165e-24     Acceleration       0.19694       0.14743     1.3359       0.18493   Number of observations: 94, Error degrees of freedom: 91 Root Mean Squared Error: 4.12 R-squared: 0.743,  Adjusted R-Squared: 0.738 F-statistic vs. constant model: 132, p-value = 1.38e-27

La visualización del objeto de modelo utiliza los nombres de variable proporcionados en la tabla de entrada.

Si los datos de entrada se almacenan como una matriz, puede especificar la fórmula utilizando nombres de variable predeterminados como, y.yx1x2 Por ejemplo, cargue los datos de ejemplo.carsmall Cree una matriz que contenga las variables predictoras y.WeightAcceleration A continuación, ajuste el siguiente modelo a los datos:

MPG=β0+β1Weight+β2Acceleration

load carsmall X = [Weight,Acceleration]; y = MPG; mdl = fitlm(X,y,'y ~ x1 + x2')
mdl =    Linear regression model:     y ~ 1 + x1 + x2  Estimated Coefficients:                     Estimate         SE         tStat       pValue                      __________    __________    _______    __________      (Intercept)        45.155        3.4659     13.028    1.6266e-22     x1             -0.0082475    0.00059836    -13.783    5.3165e-24     x2                0.19694       0.14743     1.3359       0.18493   Number of observations: 94, Error degrees of freedom: 91 Root Mean Squared Error: 4.12 R-squared: 0.743,  Adjusted R-Squared: 0.738 F-statistic vs. constant model: 132, p-value = 1.38e-27

El término de la fórmula de la especificación del modelo corresponde a la primera columna de la matriz de variables predictoras.x1X El término corresponde a la segunda columna de la matriz de entrada.x2 El término corresponde a la variable de respuesta.y

Ejemplos de modelos lineales

Utilizar y ajustar modelos lineales.fitlmstepwiselm

Intercepción y dos predictores

Para un modelo de regresión lineal con una intercepción y dos predictores de efectos fijos, como

yi=β0+β1xi1+β2xi2+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1 + x2'

Sin intercepción y dos predictores

Para un modelo de regresión lineal sin intercepción y dos predictores de efectos fijos, como

yi=β1xi1+β2xi2+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ -1 + x1 + x2'

Intercepción, dos predictores y un término de interacción

Para un modelo de regresión lineal con una intercepción, dos predictores de efectos fijos y un término de interacción, como

yi=β0+β1xi1+β2xi2+β3xi1xi2+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1*x2'

O

'y ~ x1 + x2 + x1:x2'

Intercepción, tres predictores y todos los efectos de interacción

Para un modelo de regresión lineal con una intercepción, tres predictores de efectos fijos y efectos de interacción entre los tres predictores más todos los términos de orden inferior, como

yi=β0+β1xi1+β2xi2+β3xi3+β4x1xi2+β5x1xi3+β6x2xi3+β7xi1xi2xi3+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1*x2*x3'

Intercepción, tres predictores y efectos de interacción seleccionados

Para un modelo de regresión lineal con una intercepción, tres predictores de efectos fijos y efectos de interacción entre dos de los predictores, como

yi=β0+β1xi1+β2xi2+β3xi3+β4x1xi2+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1*x2 + x3'

O

'y ~ x1 + x2 + x3 + x1:x2'

Intercepción, tres predictores y efectos de interacción de orden inferior solo

Para un modelo de regresión lineal con una intercepción, tres predictores de efectos fijos y efectos de interacción por pares entre los tres predictores, pero excluyendo un efecto de interacción entre los tres predictores simultáneamente, como

yi=β0+β1xi1+β2xi2+β3xi3+β4x1xi2+β5xi1xi3+β6xi2xi3+εi,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1*x2*x3 - x1:x2:x3'

Ejemplos de modelos de efectos mixtos lineales

Utilice y para ajustar modelos de efectos mixtos lineales.fitlmefitlmematrix

Intercepción de efectos aleatorios, sin predictores

Para un modelo de efectos mixtos lineales que contiene una intercepción aleatoria pero sin términos predictores, como

yim=β0m,

Dónde

β0m=β00+b0m,b0mN(0,σ02)

y es la variable de agrupamiento con niveles, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:gm

'y ~ (1 | g)'

Intercepción aleatoria y pendiente fija para un predictor

Para un modelo de efectos mixtos lineales que contiene una intersección fija, una interceptación aleatoria y una pendiente fija para la variable predictora continua, como

yim=β0m+β1xim,

Dónde

β0m=β00+b0m,b0mN(0,σ02)

y es la variable de agrupamiento con niveles, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:gm

'y ~ x1 + (1 | g)'

Intercepción aleatoria y pendiente aleatoria para un predictor

Para un modelo de efectos mixtos lineales que contiene una intercepción fija, más una intercepción aleatoria y una pendiente aleatoria que tienen una posible correlación entre ellas, como

yim=β0m+β1mxim,

Dónde

β0m=β00+b0m

β1m=β10+b1m

[b0mb1m]N{0,σ2D(θ)}

y es una matriz de covarianza semidefinida 2 por 2 simétrica y positiva, parametrizada por un vector de componente de varianza θ, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:D

'y ~ x1 + (x1 | g)'

El patrón de la matriz de covarianzas de efectos aleatorios viene determinado por la función de ajuste del modelo. Para especificar el patrón de matriz de covarianza, utilice los pares nombre-valor disponibles al ajustar el modelo.fitlme Por ejemplo, puede especificar la suposición de que la intersección aleatoria y la pendiente aleatoria son independientes entre sí mediante el argumento de par nombre-valor en.'CovariancePattern'fitlme

Ejemplos de modelos lineales generalizados

Utilizar y ajustar modelos lineales generalizados.fitglmstepwiseglm

En un modelo lineal generalizado, la variable de respuesta tiene una distribución distinta de la normal, pero puede representar el modelo como una ecuación que es lineal en los coeficientes de regresión.y La especificación de un modelo lineal generalizado requiere tres partes:

  • Distribución de la variable de respuesta

  • Función de enlace

  • El predictor lineal

La distribución de la variable de respuesta y la función de vínculo se especifican mediante argumentos de par nombre-valor en la función de ajuste o.fitglmstepwiseglm

La porción de predictor lineal de la ecuación, que aparece en el lado derecho del símbolo en la fórmula de especificación del modelo, utiliza la notación Wilkinson de la misma manera que para los ejemplos de modelos lineales.~

Un modelo lineal generalizado modela la función de enlace, en lugar de la respuesta real, como.y Esto se refleja en la visualización de salida para el objeto de modelo.

Intercepción y dos predictores

Para un modelo de regresión lineal generalizada con una intercepción y dos predictores, como

log(yi)=β0+β1xi1+β2xi2,

especificar la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y ~ x1 + x2'

Ejemplos de modelos de efectos mixtos lineales generalizados

Utilíce para ajustar modelos de efectos mixtos lineales generalizados.fitglme

En un modelo lineal generalizado de efectos mixtos, la variable de respuesta tiene una distribución distinta de la normal, pero puede representar el modelo como una ecuación que es lineal en los coeficientes de regresión.y La especificación de un modelo lineal generalizado requiere tres partes:

  • Distribución de la variable de respuesta

  • Función de enlace

  • El predictor lineal

La distribución de la variable de respuesta y la función de vínculo se especifican mediante argumentos de par nombre-valor en la función de ajuste.fitglme

La porción de predictor lineal de la ecuación, que aparece en el lado derecho del símbolo en la fórmula de especificación del modelo, utiliza la notación Wilkinson de la misma manera que para los ejemplos de modelo de efectos mixtos lineales.~

Un modelo lineal generalizado modela la función de enlace como, no la propia respuesta.y Esto se refleja en la visualización de salida para el objeto de modelo.

El patrón de la matriz de covarianzas de efectos aleatorios viene determinado por la función de ajuste del modelo. Para especificar el patrón de matriz de covarianza, utilice los pares nombre-valor disponibles al ajustar el modelo.fitglme Por ejemplo, puede especificar la suposición de que la intersección aleatoria y la pendiente aleatoria son independientes entre sí mediante el argumento de par nombre-valor en.'CovariancePattern'fitglme

Intercepción aleatoria y pendiente fija para un predictor

Para un modelo lineal generalizado de efectos mixtos que contiene una intersección fija, una interceptación aleatoria y una pendiente fija para la variable predictora continua, donde la respuesta se puede modelar utilizando una distribución de Poisson, como

log(yim)=β0+β1xim+bi,

Dónde

biN(0,σb2)

y es la variable de agrupamiento con niveles, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:gm

'y ~ x1 + (1 | g)'

Ejemplos de modelos de medidas repetidas

Se utiliza para adaptarse a modelos de medidas repetidas.fitrm

Un predictor

Para un modelo de medidas repetidas con cinco mediciones de respuesta y una variable predictora, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y1-y5 ~ x1'

Tres predictores y un término de interacción

Para un modelo de medidas repetidas con cinco mediciones de respuesta y tres variables predictoras, además de una interacción entre dos de las variables predictoras, especifique la fórmula del modelo utilizando la notación Wilkinson de la siguiente manera:

'y1-y5 ~ x1*x2 + x3'

Referencias

[1] Wilkinson, G. N., and C. E. Rogers. Symbolic description of factorial models for analysis of variance. J. Royal Statistics Society 22, pp. 392–399, 1973.