Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

CompactLinearModel

Modelo de regresión lineal compacta

Descripción

es una versión compacta de un objeto de modelo de regresión lineal completa.CompactLinearModelLinearModel Dado que un modelo compacto no almacena los datos de entrada utilizados para ajustarse al modelo o a la información relacionada con el proceso de conexión, un objeto consume menos memoria que un objeto.CompactLinearModelLinearModel Todavía puede utilizar un modelo compacto para predecir las respuestas utilizando nuevos datos de entrada, pero algunas funciones de objeto no funcionan con un modelo compacto.LinearModel

Creación

Cree un modelo a partir de un modelo completo y entrenado utilizando.CompactLinearModelLinearModelcompact

Propiedades

expandir todo

Estimaciones de coeficiente

Esta propiedad es de solo lectura.

Matriz de covarianza de estimaciones de coeficiente, especificada como una-por-matriz de valores numéricos. es el número de coeficientes en el modelo ajustado.ppp

Para obtener más información, consulte.Errores estándar de coeficiente y intervalos de confianza

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Nombres de coeficiente, especificados como una matriz de celdas de vectores de caracteres, cada uno de los cuales contiene el nombre del término correspondiente.

Tipos de datos: cell

Esta propiedad es de solo lectura.

Valores de coeficiente, especificados como una tabla. contiene una fila por cada coeficiente y estas columnas:Coefficients

  • — Valor del coeficiente EstimadoEstimate

  • — Error estándar de la estimaciónSE

  • —-estadística para una prueba de que el coeficiente es cerotStatt

  • —-valor para el-estadísticopValuept

Utilice (sólo para un modelo de regresión lineal) o para realizar otras pruebas en los coeficientes.anovacoefTest Se utiliza para encontrar los intervalos de confianza de las estimaciones de coeficiente.coefCI

Para obtener cualquiera de estas columnas como un vector, índice en la propiedad mediante la notación de puntos. Por ejemplo, obtenemos el vector de coeficiente estimado en el modelo:mdl

beta = mdl.Coefficients.Estimate

Tipos de datos: table

Esta propiedad es de solo lectura.

Número de coeficientes del modelo, especificado como un entero positivo. incluye los coeficientes que se establecen en cero cuando los términos del modelo son deficientes de rango.NumCoefficients

Tipos de datos: double

Esta propiedad es de solo lectura.

Número de coeficientes estimados en el modelo, especificado como un entero positivo. no incluye los coeficientes que se establecen en cero cuando los términos del modelo son deficientes de rango. son los grados de libertad para la regresión.NumEstimatedCoefficientsNumEstimatedCoefficients

Tipos de datos: double

Resumen de estadísticas

Esta propiedad es de solo lectura.

Grados de libertad para el error (residuos), igual al número de observaciones menos el número de coeficientes estimados, especificado como un entero positivo.

Tipos de datos: double

Esta propiedad es de solo lectura.

Logverosimilitud de valores de respuesta, especificado como un valor numérico, basado en la suposición de que cada valor de respuesta sigue una distribución normal. La media de la distribución normal es el valor de respuesta ajustado (predicho) y la varianza es la.MSE

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Criterio para la comparación de modelos, especificado como una estructura con estos campos:

  • — Criterio de información de Akaike. , donde es el logverosimilitud y es el número de parámetros estimados.AICAIC = –2*logL + 2*mlogLm

  • — Criterio de información de Akaike corregido para el tamaño de la muestra. , donde está el número de observaciones.AICcAICc = AIC + (2*m*(m+1))/(n–m–1)n

  • — Criterio de información bayesiana. .BICBIC = –2*logL + m*log(n)

  • — Criterio de información consistente de Akaike. .CAICCAIC = –2*logL + m*(log(n)+1)

Los criterios de información son herramientas de selección de modelo que puede utilizar para comparar varios modelos aptos para los mismos datos. Estos criterios son medidas basadas en la probabilidad de ajuste de modelo que incluyen una penalización por complejidad (concretamente, el número de parámetros). Diferentes criterios de información se distinguen por la forma de la sanción.

Cuando se comparan varios modelos, el modelo con el valor de criterio de información más bajo es el modelo que mejor se ajusta. El modelo de mejor ajuste puede variar en función del criterio utilizado para la comparación de modelos.

Para obtener cualquiera de los valores de criterio como un escalar, índice en la propiedad mediante la notación de puntos. Por ejemplo, obtenemos el valor AIC en el modelo:aicmdl

aic = mdl.ModelCriterion.AIC

Tipos de datos: struct

Esta propiedad es de solo lectura.

Error medio cuadrado (residuos), especificado como un valor numérico.

MSE = SSE / DFE,

donde está el error cuadrado medio, es la suma de los errores cuadrados, y es los grados de libertad.MSESSEDFE

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Error medio cuadrado de raíz (residuos), especificado como un valor numérico.

RMSE = sqrt(MSE),

donde está el error cuadrado medio cuadrático y es el error cuadrado medio.RMSEMSE

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Valor R cuadrado para el modelo, especificado como una estructura con dos campos:

  • — Ordinario (sin ajustar) R cuadradoOrdinary

  • — R cuadrado ajustado para el número de coeficientesAdjusted

El valor R cuadrado es la proporción de la suma total de los cuadrados explicados por el modelo. El valor R cuadrado ordinario se relaciona con las propiedades y:SSRSST

Rsquared = SSR/SST = 1 – SSE/SST,

donde está la suma total de los cuadrados, es la suma de los errores cuadrados, y es la suma de la regresión de los cuadrados.SSTSSESSR

Para obtener más información, consulte.Coeficiente de determinación (R-cuadrado)

Para obtener cualquiera de estos valores como un valor escalar, índice en la propiedad mediante la notación de puntos. Por ejemplo, obtenga el valor R cuadrado ajustado en el modelo:mdl

r2 = mdl.Rsquared.Adjusted

Tipos de datos: struct

Esta propiedad es de solo lectura.

Suma de errores cuadrados (residuales), especificado como un valor numérico.

El teorema de Pitágoras implica

SST = SSE + SSR,

donde está la suma total de los cuadrados, es la suma de los errores cuadrados, y es la suma de la regresión de los cuadrados.SSTSSESSR

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Suma de los cuadrados de regresión, especificado como un valor numérico. La suma de los cuadrados de la regresión es igual a la suma de las desviaciones cuadradas de los valores ajustados de su media.

El teorema de Pitágoras implica

SST = SSE + SSR,

donde está la suma total de los cuadrados, es la suma de los errores cuadrados, y es la suma de la regresión de los cuadrados.SSTSSESSR

Tipos de datos: single | double

Esta propiedad es de solo lectura.

Suma total de cuadrados, especificado como un valor numérico. La suma total de los cuadrados es igual a la suma de las desviaciones cuadradas del vector de respuesta de la.ymean(y)

El teorema de Pitágoras implica

SST = SSE + SSR,

donde está la suma total de los cuadrados, es la suma de los errores cuadrados, y es la suma de la regresión de los cuadrados.SSTSSESSR

Tipos de datos: single | double

Método de ajuste

Esta propiedad es de solo lectura.

Información de ajuste robusta, especificada como una estructura con los campos descritos en esta tabla.

CampoDescripción
WgtFunFunción de ponderación robusta, como (ver)'bisquare''RobustOpts'
TuneConstante de sintonización. Este campo está vacío () si es o si es un manejador de función para una función de ponderación personalizada con la constante de sintonización predeterminada 1.[]WgtFun'ols'WgtFun
WeightsVector de pesos utilizado en la iteración final de ajuste robusto. Este campo está vacío para un objeto.CompactLinearModel

Esta estructura está vacía a menos que encaje el modelo utilizando una regresión robusta.

Tipos de datos: struct

Datos de entrada

Esta propiedad es de solo lectura.

Información del modelo, especificada como un objeto.LinearFormula

Visualice la fórmula del modelo ajustado utilizando la notación de puntos:mdl

mdl.Formula

Esta propiedad es de solo lectura.

Número de observaciones de la función de empalme utilizada en el empalme, especificada como un entero positivo. es el número de observaciones proporcionadas en la tabla, el DataSet o la matriz original, menos las filas excluidas (establecidas con el argumento de par nombre-valor) o las filas con valores faltantes.NumObservations'Exclude'

Tipos de datos: double

Esta propiedad es de solo lectura.

Número de variables predictoras utilizadas para ajustarse al modelo, especificadas como un entero positivo.

Tipos de datos: double

Esta propiedad es de solo lectura.

Número de variables en los datos de entrada, especificadas como un entero positivo. es el número de variables en la tabla o DataSet original, o el número total de columnas en la matriz predictora y el vector de respuesta.NumVariables

también incluye cualquier variable que no se utilice para ajustar el modelo como predictores o como la respuesta.NumVariables

Tipos de datos: double

Esta propiedad es de solo lectura.

Nombres de los predictores que se utilizan para ajustarse al modelo, especificado como una matriz de vectores de caracteres de celda.

Tipos de datos: cell

Esta propiedad es de solo lectura.

Nombre de variable de respuesta, especificado como un vector de caracteres.

Tipos de datos: char

Esta propiedad es de solo lectura.

Información sobre las variables contenidas en, especificadas como una tabla con una fila para cada variable y las columnas descritas en esta tabla.Variables

ColumnaDescripción
ClassClase de variable, especificada como una matriz de celdas de vectores de caracteres, como y'double''categorical'
Range

Rango variable, especificado como una matriz de vectores de celdas

  • Variable continua: Vector de dos elementos [min,max], los valores mínimo y máximo

  • Variable categórica: Vector de valores de variable distintos

InModelIndicador de qué variables se encuentran en el modelo ajustado, especificado como vector lógico. El valor es si el modelo incluye la variable.true
IsCategoricalIndicador de variables categóricas, especificado como vector lógico. El valor es si la variable es categórica.true

también incluye cualquier variable que no se utilice para ajustar el modelo como predictores o como la respuesta.VariableInfo

Tipos de datos: table

Esta propiedad es de solo lectura.

Nombres de variables, especificadas como una matriz de vectores de caracteres de celda.

  • Si el ajuste se basa en una tabla o un conjunto de datos, esta propiedad proporciona los nombres de las variables de la tabla o DataSet.

  • Si el ajuste se basa en una matriz predictora y un vector de respuesta, contiene los valores especificados por el argumento de par nombre-valor del método de empalme.VariableNames'VarNames' El valor predeterminado es.'VarNames'{'x1','x2',...,'xn','y'}

también incluye cualquier variable que no se utilice para ajustar el modelo como predictores o como la respuesta.VariableNames

Tipos de datos: cell

Funciones del objeto

expandir todo

FEVALPredecir las respuestas del modelo de regresión lineal utilizando una entrada para cada predictor
PredecirPredecir las respuestas del modelo de regresión lineal
AleatorioSimular respuestas con ruido aleatorio para el modelo de regresión lineal
anovaAnálisis de varianza para el modelo de regresión lineal
coefCILos intervalos de confianza de las estimaciones de coeficiente del modelo de regresión lineal
coefTestPrueba de hipótesis lineal sobre coeficientes del modelo de regresión lineal
plotEffectsTrazar los principales efectos de los predictores en el modelo de regresión lineal
plotInteractionTrazar los efectos de interacción de dos predictores en el modelo de regresión lineal
plotPartialDependenceCree parcelas de dependencia parcial (PDP) y de expectativa condicional individual (ICE)
plotSliceParcela de rodajas a través de superficie de regresión lineal ajustada

Ejemplos

contraer todo

Ajuste un modelo de regresión lineal a los datos y reduzca el tamaño de un modelo de regresión lineal completo y ajustado descartando los datos de muestra y cierta información relacionada con el proceso de adaptación.

Cargue el conjunto de datos, que contiene 15.000 observaciones y 45 variables predictoras.largedata4reg

load largedata4reg

Ajuste un modelo de regresión lineal a los datos.

mdl = fitlm(X,Y);

Compacte el modelo.

compactMdl = compact(mdl);

El modelo compacto descarta los datos de muestra originales y cierta información relacionada con el proceso de adaptación.

Compare el tamaño del modelo completo y el modelo compacto.mdlcompactMdl

vars = whos('compactMdl','mdl'); [vars(1).bytes,vars(2).bytes]
ans = 1×2

       83506    11410618

El modelo compacto consume menos memoria que el modelo completo.

Capacidades ampliadas

Introducido en R2016a