Linear Regression

¿Qué es la regresión lineal?

La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos.

Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la relación entre una variable dependiente \(y\) (también conocida como la respuesta) como una función de una o varias variables independientes \(X_i\) (denominadas predictores). La ecuación general correspondiente a un modelo de regresión lineal es:

\[Y = \beta_0 + \sum \ \beta_k X_k + \epsilon_i\]

donde \(\beta\) representa las estimaciones de parámetros lineales que se deben calcular y \(\epsilon\) representa los términos de error.

Tipos de regresión lineal

Regresión lineal simple: modelos que utilizan un único predictor. La ecuación general es:

\[Y = \beta_0 + \beta_1 X+ \epsilon\]

Gráfica que muestra línea de regresión lineal, valores de respuesta (accidentes de tráfico mortales por estado) y valores predictivos (población del estado).

Ejemplo de regresión lineal simple que muestra cómo predecir el número de accidentes de tráfico mortales en un estado (variable de respuesta, \(Y\)) en comparación con la población del estado (variable predictora, \(X\)). (Consulte el ejemplo de código de MATLAB® y cómo usar el operador mldivide para estimar los coeficientes de una regresión lineal simple).

Regresión lineal múltiple: modelos que utilizan múltiples predictores. Esta regresión tiene múltiples \(X_i\) para predecir la respuesta, \(Y\). Este es un ejemplo de la ecuación:

\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2+ \epsilon\]

Gráfica que muestra regresión lineal múltiple, valores de respuesta (MPG) y valores predictivos (peso y caballos de potencia).

Ejemplo de regresión lineal múltiple, que predice las millas por galón (MPG) de diferentes coches (variable de respuesta, \(Y\)) en función del peso y la potencia (variables predictivas, \(X_j\)). (Consulte el ejemplo de código de MATLAB y cómo usar la función de regresión y determinar la importancia de la relación de regresión lineal múltiple).

Regresión lineal multivariante: modelos para varias variables de respuesta. Esta regresión tiene múltiples \(Y_i\) que derivan de los mismos datos \(Y\). Se expresan con fórmulas diferentes. Este es un ejemplo del sistema con 2 ecuaciones:

\[Y_1 = \beta_{01} + \beta_{11} X_1 + \epsilon_1\]

\[Y_2 = \beta_{02} + \beta_{1 2}X_1 + \epsilon_2\]

Gráfica que muestra regresión lineal multivariante, valores de respuesta (estimaciones de gripe para 9 regiones) y valores predictivos (semana del año).

Ejemplo de regresión lineal multivariante que muestra cómo predecir las estimaciones de gripe en 9 regiones de EE. UU. (variables de respuesta, \(Y_i\)), basadas en la semana del año (variable predictora, \(X\)). (Consulte el ejemplo de código de MATLAB y cómo utilizar la función mvregress para determinar los coeficientes estimados de una regresión lineal multivariante).

Regresión lineal múltiple multivariante: modelos que utilizan varios predictores para múltiples variables de respuesta. Esta regresión tiene múltiples \(X_i\) para predecir varias respuestas \(Y_i\). Esta es una generalización de las ecuaciones:

Ecuación para calcular múltiples respuestas Yi a partir de múltiples predictores Xi utilizando regresión lineal multivariante lineal.

Ejemplo de regresión lineal múltiple multivariante que calcula las MPG en ciudad y autopista (como variables de respuesta, \(Y_1\) y \(Y_2\)) a partir de tres variables: distancia entre ejes, peso en vacío y tipo de combustible (variables predictoras, \(X_1\), \(X_2\) y \(X_3\)). (Consulte el ejemplo de código de MATLAB y cómo utilizar la función mvregress para estimar los coeficientes).

Aplicaciones de la regresión lineal

La regresión lineal cuenta con ciertas caracteríticas ideales para las siguientes aplicaciones:

  • Predicción o pronóstico: utilice un modelo de regresión para crear un modelo de pronóstico para un conjunto de datos específico. A partir de la moda, puede usar la regresión para predecir valores de respuesta donde solo se conocen los predictores.
  • Fuerza de la regresión: utilice un modelo de regresión para determinar si existe una relación entre una variable y un predictor,y cuán estrecha es esta relación.

Regresión lineal con MATLAB

Los ingenieros suelen crear modelos de regresión lineal simple con MATLAB. Para la regresión lineal múltiple y multivariante, puede utilizar Statistics and Machine Learning Toolbox™ desde MATLAB. Permite la regresión por pasos, robusta y multivariante para:

  • Generar predicciones
  • Comparar ajustes de modelos lineales
  • Representar los valores residuales
  • Evaluar la bondad de ajuste
  • Detectar valores atípicos

Para crear un modelo lineal que permita ajustar curvas y superficies a sus datos, consulte Curve Fitting Toolbox™.