Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Variables indicadoras ficticias

¿Qué son las variables ficticias?

Al realizar el análisis de regresión, es común incluir variables predictoras continuas y categóricas (cuantitativas y cualitativas). Cuando se incluye una variable independiente categórica, es importante no introducir la variable como una matriz numérica. Las matrices numéricas tienen orden y magnitud. Una variable categórica puede tener orden (por ejemplo, una variable ordinal), pero no tiene magnitud. El uso de una matriz numérica implica una "distancia" conocida entre las categorías.

La forma adecuada de incluir predictores categóricos es como variables indicadoras ficticias. Una variable indicadora tiene los valores 0 y 1. Una variable categórica con categorías se puede representar por – 1 variables indicadoras.cc

Por ejemplo, supongamos que tiene una variable categórica con niveles.{Small,Medium,Large} Puede representar esta variable utilizando dos variables ficticias, como se muestra en esta figura.

En este ejemplo,X1 es una variable ficticia que tiene el valor 1 para el grupo y 0 en caso contrario.MediumX2 es una variable ficticia que tiene el valor 1 para el grupo y 0 en caso contrario.Large Juntas, estas dos variables representan las tres categorías. Las observaciones del grupo tienen 0s para ambas variables ficticias.Small

La categoría representada por todos los 0s es la.Grupo de referencia Cuando se incluyen las variables ficticias en un modelo de regresión, los coeficientes de las variables ficticias se interpretan con respecto al grupo de referencia.

Creación de variables ficticias

Creación automática de variables ficticias

La mayoría de las funciones de ajuste de clasificación y regresión aceptan predictores categóricos.

  • Si los Datos predictores se encuentran en una tabla, la función asume que una variable es categórica si contiene valores lógicos, valores categóricos, una matriz de cadenas o una matriz de vectores de caracteres.

  • Si los Datos predictores son una matriz, la función asume que todos los predictores son continuos. Para identificar los predictores categóricos, utilice el argumento de par nombre-valor.'CategoricalPredictors''CategoricalVars'

Para funciones de ajuste de regresión paramétrica como y, si hay niveles únicos en la matriz categórica, entonces la función de ajuste estima – 1 coeficientes para el predictor categórico.fitlmfitglmcc

Creación manual de variables ficticias

Si prefiere crear su propia matriz de diseño de variable ficticia, utilice.dummyvar Esta función acepta un vector de columna numérico o categórico y devuelve una matriz de variables indicadoras. La matriz de diseño de variable ficticia tiene una columna para cada grupo y una fila para cada observación.

Por ejemplo, hay cinco filas que corresponden al número de filas en, y dos columnas para los grupos únicos y.

gender = nominal({'Male';'Female';'Female';'Male';'Female'}); dv = dummyvar(gender)
dv =       0     1      1     0      1     0      0     1      1     0
genderFemaleMale El orden de las columnas corresponde al orden de los niveles en.gender Para matrices nominales, el orden predeterminado es ascendente alfabéticamente.

Para utilizar estas variables ficticias en un modelo de regresión, debe eliminar una columna (para crear un grupo de referencia) o ajustar un modelo de regresión sin término de intercepción. Para el ejemplo de género, solo se necesita una variable ficticia para representar dos géneros. Observe lo que sucede si agrega un término de intercepción a la matriz de diseño completa,. La matriz de diseño con un término de intercepción no es de rango completo, y no es invertible.dv

X = [ones(5,1) dv] 
X =       1     0     1      1     1     0      1     1     0      1     0     1      1     1     0
rank(X)
ans =       2
Debido a esta dependencia lineal, utilice sólo-1 variables indicadoras para representar una variable categórica con categorías en un modelo de regresión con un término de intercepción.cc

Consulte también

| | |

Temas relacionados