Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Elija Opciones de modelo de regresión

Elija tipo de modelo de regresión

Puede usar la aplicación regresión Learner para entrenar automáticamente una selección de diferentes modelos en sus datos. Utilice el entrenamiento automatizado para probar rápidamente una selección de tipos de modelo y, a continuación, explore modelos prometedores de forma interactiva. Para empezar, Pruebe estas opciones primero

Botones de modelo de regresión de introducciónDescripción

All Quick-To-Train


Prueba el botón primero.All Quick-To-Train La aplicación entrena todos los tipos de modelos que son típicamente rápidos para entrenar.

All


Utilice el botón para entrenar todos los tipos de modelos disponibles.All Entrena cada tipo independientemente de cualquier modelo entrenado previo. Puede llevar mucho tiempo.

Para obtener más información sobre la formación automatizada de modelos, consulte.Entrenamiento de modelo de regresión automatizada

Si desea explorar los modelos uno a la vez, o si ya sabe qué tipo de modelo desea, puede seleccionar modelos individuales o entrenar a un grupo del mismo tipo. Para ver todas las opciones de modelo de regresión disponibles, en la pestaña, haga clic en la flecha de la sección para expandir la lista de modelos de regresión.Regression LearnerModel Type Las opciones de la galería son puntos de partida preestablecidos con diferentes ajustes, adecuados para un rango de diferentes problemas de regresión.

Para obtener ayuda para elegir el mejor tipo de modelo para su problema, consulte las tablas que muestran las características típicas de los diferentes tipos de modelo de regresión. Decida la contrapartida que desea en cuanto a velocidad, flexibilidad e interpretabilidad. El mejor tipo de modelo depende de sus datos.

Sugerencia

Para evitar el sobreajuste, busque un modelo menos flexible que proporcione una precisión suficiente. Por ejemplo, busque modelos simples como árboles de regresión que sean rápidos y fáciles de interpretar. Si los modelos no son lo suficientemente precisos para predecir la respuesta, elija otros modelos con mayor flexibilidad, como conjuntos. Para controlar la flexibilidad, consulte los detalles de cada tipo de modelo.

Características de tipos de modelo de regresión

Tipo de modelo de regresiónInterpretación

Modelos de regresión lineal


Fácil

Los árboles de regresión


Fácil

Máquinas de vectores de soporte


Fácil para SVMs lineales. Duro para otros granos.

Modelos de regresión de proceso Gaussiano


Duro

Conjuntos de árboles


Duro

Para leer una descripción de cada modelo en el aprendizaje de regresión, cambie a la vista de detalles en la lista de todos los ajustes preestablecidos del modelo.

Sugerencia

Las opciones de la galería son los puntos de partida predefinidos con diferentes ajustes.Model Type Después de elegir un tipo de modelo, como árboles de regresión, intente entrenar todos los ajustes preestablecidos para ver cuál produce el mejor modelo con sus datos.

Para obtener instrucciones de flujo de trabajo, consulte.Entrenar modelos de regresión en la aplicación de regresión Learner

Soporte de predictor categórico

En el aprendizaje de regresión, todos los tipos de modelo admiten predictores categóricos.

Sugerencia

Si tiene predictores categóricos con muchos valores únicos, entrenar modelos lineales con interacción o términos cuadráticos y modelos lineales escalonado puede usar mucha memoria. Si el modelo no se entrena, intente quitar estos predictores categóricos.

Modelos de regresión lineal

Los modelos de regresión lineal tienen predictores que son lineales en los parámetros del modelo, son fáciles de interpretar y son rápidos para realizar predicciones. Estas características hacen modelos populares modelos de regresión lineal para probar primero. Sin embargo, la forma muy restringida de estos modelos significa que a menudo tienen una precisión predictiva baja. Después de ajustar un modelo de regresión lineal, intente crear modelos más flexibles, como árboles de regresión, y compare los resultados.

Sugerencia

En la galería, haga clic enModel TypeAll Linearpara probar cada una de las opciones de regresión lineal y ver qué configuración produce el mejor modelo con sus datos. Seleccione el mejor modelo en la lista historial e intente mejorar ese modelo utilizando la selección de características y cambiando algunas opciones avanzadas.

Tipo de modelo de regresiónInterpretaciónFlexibilidad del modelo

Linear


FácilMuy bajo

Interactions Linear


FácilMedio

Robust Linear


FácilMuy bajo. Menos sensible a los valores atípicos, pero puede ser lento para entrenar.

Stepwise Linear


FácilMedio

Sugerencia

Para ver un ejemplo de flujo de trabajo, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Opciones de regresión lineal avanzada

El aprendizaje de regresión utiliza la función para entrenar modelos lineales, de interacciones lineales y lineales robustos.fitlm La aplicación utiliza la función para entrenar modelos lineales stepwise.stepwiselm

Para los modelos lineal, interacciones lineales y lineales robustos puede establecer estas opciones:

  • Terms

    Especifique los términos que se utilizarán en el modelo lineal. Puede elegir entre:

    • Linear. Un término constante y términos lineales en los predictores

    • Interactions. Un término constante, términos lineales y términos de interacción entre los predictores

    • Pure Quadratic. Un término constante, términos lineales y términos que son puramente cuadráticos en cada uno de los predictores

    • Quadratic. Un término constante, términos lineales y términos cuadráticos (incluidas las interacciones)

  • Robust option

    Especifique si desea utilizar una función objetiva robusta y hacer que el modelo sea menos sensible a los valores atípicos. Con esta opción, el método de empalme asigna automáticamente pesos inferiores a los puntos de datos que tienen más probabilidades de ser valores atípicos.

La regresión lineal stepwise comienza con un modelo inicial y agrega y elimina sistemáticamente los términos del modelo en función de la potencia explicativa de estos modelos incrementalmente más grandes y más pequeños. Para los modelos de stepwise linear, puede establecer estas opciones:

  • Initial terms

    Especifique los términos que se incluyen en el modelo inicial del procedimiento escalonado. Puede elegir entre Constant, Linear, Interactions, Pure QuadraticY Quadratic.

  • Upper bound on terms

    Especifique el orden más alto de los términos que el procedimiento escalonado puede Agregar al modelo. Puede elegir entre Linear, Interactions, Pure QuadraticY Quadratic.

  • Maximum number of steps

    Especifique el número máximo de modelos lineales diferentes que se pueden intentar en el procedimiento escalonado. Para acelerar el entrenamiento, intenta reducir el número máximo de pasos. Al seleccionar un pequeño número máximo de pasos, se reducen las probabilidades de encontrar un buen modelo.

Sugerencia

Si tiene predictores categóricos con muchos valores únicos, entrenar modelos lineales con interacción o términos cuadráticos y modelos lineales escalonado puede usar mucha memoria. Si el modelo no se entrena, intente quitar estos predictores categóricos.

Los árboles de regresión

Los árboles de regresión son fáciles de interpretar, rápidos para el ajuste y la predicción, y bajos en el uso de memoria. Trate de cultivar árboles más pequeños con menos hojas más grandes para evitar el sobreajuste. Controle el tamaño de la hoja con el ajuste.Minimum leaf size

Sugerencia

En la galería, haga clic enModel TypeAll Treesprobar cada una de las opciones del árbol de regresión y ver qué configuración produce el mejor modelo con sus datos. Seleccione el mejor modelo en la lista historial e intente mejorar ese modelo utilizando la selección de características y cambiando algunas opciones avanzadas.

Tipo de modelo de regresiónInterpretaciónFlexibilidad del modelo

Fine Tree


FácilAlto

Muchas hojas pequeñas para una función de respuesta altamente flexible (tamaño mínimo de la hoja es 4.)

Medium Tree


FácilMedio

Hojas medianas para una función de respuesta menos flexible (tamaño mínimo de la hoja es 12.)

Coarse Tree


FácilBajo

Pocas hojas grandes para una función de respuesta gruesa (tamaño mínimo de la hoja es 36.)

Para predecir una respuesta de un árbol de regresión, siga el árbol desde el nodo raíz (principio) hasta un nodo hoja. El nodo hoja contiene el valor de la respuesta.

árboles son binarios.Statistics and Machine Learning Toolbox™ Cada paso de una predicción implica comprobar el valor de una variable predictora. Por ejemplo, aquí hay un árbol de regresión simple

Este árbol predice la respuesta basada en dos predictores y.x1x2 Para realizar una predicción, empiece en el nodo superior. En cada nodo, compruebe los valores de los predictores para decidir qué rama seguir. Cuando las ramas alcanzan un nodo hoja, la respuesta se establece en el valor correspondiente a ese nodo.

Puede visualizar el modelo de árbol de regresión exportando el modelo desde la aplicación y, a continuación, escribiendo:

view(trainedModel.RegressionTree,'Mode','graph') 

Sugerencia

Para ver un ejemplo de flujo de trabajo, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Opciones avanzadas del árbol de regresión

La aplicación de regresión Learner utiliza la función para entrenar árboles de regresión.fitrtree Puede establecer estas opciones:

  • Minimum leaf size

    Especifique el número mínimo de muestras de formación utilizadas para calcular la respuesta de cada nodo hoja. Cuando crezca un árbol de regresión, tenga en cuenta su simplicidad y poder predictivo. Para cambiar el tamaño mínimo de la hoja, haga clic en los botones o introduzca un valor entero positivo en el cuadro.Minimum leaf size

    • Un árbol fino con muchas hojas pequeñas suele ser muy preciso en los datos de entrenamiento. Sin embargo, es posible que el árbol no muestre una precisión comparable en un conjunto de pruebas independiente. Un árbol muy frondoso tiende a sobreajustarse, y su precisión de validación es a menudo mucho más baja que su precisión de entrenamiento (o reenvío).

    • En contraste, un árbol grueso con menos hojas grandes no alcanza una alta precisión de entrenamiento. Pero un árbol grueso puede ser más robusto en que su precisión de entrenamiento puede estar cerca de la de un conjunto de prueba representativo.

    Sugerencia

    Reduzca el para crear un modelo más flexible.Minimum leaf size

  • : Solo para datos faltantes.Surrogate decision splits

    Especifique el uso suplente para las divisiones de decisión. Si tiene datos con valores faltantes, use divisiones sustitutas para mejorar la precisión de las predicciones.

    Cuando se establece enSurrogate decision splits On, el árbol de regresión encuentra como máximo 10 divisiones sustitutas en cada nodo de bifurcación. Para cambiar el número de divisiones sustitutas, haga clic en los botones o introduzca un valor entero positivo en el cuadro.Maximum surrogates per node

    Cuando se establece enSurrogate decision splits Find All, el árbol de regresión encuentra todas las divisiones sustitutas en cada nodo de bifurcación. el Find All configuración puede utilizar un tiempo y una memoria considerables.

Máquinas de vectores de soporte

Puede entrenar máquinas de vectores de soporte de regresión (SVMs) en el aprendizaje de regresión. Los SVMs lineales son fáciles de interpretar, pero pueden tener una precisión predictiva baja. Las SVMs no lineales son más difíciles de interpretar, pero pueden ser más precisas.

Sugerencia

En la galería, haga clic enModel TypeAll SVMsprobar cada una de las opciones de SVM y ver qué configuración produce el mejor modelo con sus datos. Seleccione el mejor modelo en la lista historial e intente mejorar ese modelo utilizando la selección de características y cambiando algunas opciones avanzadas.

Tipo de modelo de regresiónInterpretaciónFlexibilidad del modelo

Linear SVM


FácilBajo

Quadratic SVM


DuroMedio

Cubic SVM


DuroMedio

Fine Gaussian SVM


DuroAlto

Permite variaciones rápidas en la función de respuesta. La escala del kernel se establece en, donde es el número de predictores.sqrt(P)/4P

Medium Gaussian SVM


DuroMedio

Proporciona una función de respuesta menos flexible. La escala del kernel está configurada.sqrt(P)

Coarse Gaussian SVM


DuroBajo

Proporciona una función de respuesta rígida. La escala del kernel está configurada.sqrt(P)*4

implementa la regresión de SVM de Epsilon-insensible lineal.Statistics and Machine Learning Toolbox Esta SVM omite los errores de predicción que son menores que un número fijo ε. Son los puntos de datos que tienen errores mayores que ε.vectores de soporte La función que SVM utiliza para predecir nuevos valores depende sólo de los vectores de soporte. Para obtener más información sobre la regresión de SVM, consulte.Comprensión de la regresión de máquina de vectores de soporte

Sugerencia

Para ver un ejemplo de flujo de trabajo, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Opciones avanzadas de SVM

El aprendizaje de regresión utiliza la función para entrenar modelos de regresión de SVM.fitrsvm

Puede establecer estas opciones en la aplicación:

  • Kernel function

    La función kernel determina la transformación no lineal aplicada a los datos antes de que se capacite a la SVM. Puede elegir entre:

    • Gaussian o el kernel de la función de base radial (RBF)

    • Linear kernel, más fácil de interpretar

    • Quadratic Núcleo

    • Cubic Núcleo

  • Box constraint mode

    La restricción de caja controla la penalización impuesta a las observaciones con residuos grandes. Una restricción de cuadro más grande proporciona un modelo más flexible. Un valor más pequeño proporciona un modelo más rígido, menos sensible al sobreajuste.

    Cuando se establece enBox constraint mode Auto, la aplicación utiliza un procedimiento heurístico para seleccionar la restricción de cuadro.

    Intente afinar el modelo especificando la restricción de cuadro manualmente. Se establece enBox constraint mode Manual y especifique un valor. Cambie el valor haciendo clic en los botones o introduciendo un valor escalar positivo en el cuadro.Manual box constraint La aplicación preselecciona automáticamente un valor razonable para usted. Intente aumentar o disminuir este valor ligeramente y ver si esto mejora su modelo.

    Sugerencia

    Aumente el valor de la restricción de cuadro para crear un modelo más flexible.

  • Epsilon mode

    Los errores de predicción que son más pequeños que el valor de épsilon (ε) se omiten y se tratan como iguales a cero. Un valor de épsilon más pequeño proporciona un modelo más flexible.

    Cuando se establece enEpsilon mode Auto, la aplicación utiliza un procedimiento heurístico para seleccionar la escala del kernel.

    Intente afinar el modelo especificando el valor épsilon manualmente. Se establece enEpsilon mode Manual y especifique un valor. Cambie el valor haciendo clic en los botones o introduciendo un valor escalar positivo en el cuadro.Manual epsilon La aplicación preselecciona automáticamente un valor razonable para usted. Intente aumentar o disminuir este valor ligeramente y ver si esto mejora su modelo.

    Sugerencia

    Disminuya el valor de épsilon para crear un modelo más flexible.

  • Kernel scale mode

    La escala del kernel controla la escala de los predictores en los que el kernel varía significativamente. Una escala de kernel más pequeña proporciona un modelo más flexible.

    Cuando se establece enKernel scale mode Auto, la aplicación utiliza un procedimiento heurístico para seleccionar la escala del kernel.

    Intente afinar su modelo especificando la escala del kernel manualmente. Se establece enKernel scale mode Manual y especifique un valor. Cambie el valor haciendo clic en los botones o introduciendo un valor escalar positivo en el cuadro.Manual kernel scale La aplicación preselecciona automáticamente un valor razonable para usted. Intente aumentar o disminuir este valor ligeramente y ver si esto mejora su modelo.

    Sugerencia

    Disminuya el valor de la escala del kernel para crear un modelo más flexible.

  • Standardize

    Estandarizar los predictores los transforma de modo que tengan un medio 0 y una desviación estándar 1. Estandarizar elimina la dependencia de escalas arbitrarias en los predictores y generalmente mejora el rendimiento.

Modelos de regresión de proceso Gaussiano

Puede entrenar modelos de regresión de proceso Gaussiano (GPR) en el aprendizaje de regresión. Los modelos GPR son a menudo muy precisos, pero pueden ser difíciles de interpretar.

Sugerencia

En la galería, haga clic enModel TypeAll GPR Modelsprobar cada una de las opciones del modelo GPR y ver qué configuraciones producen el mejor modelo con sus datos. Seleccione el mejor modelo en la lista historial e intente mejorar ese modelo utilizando la selección de características y cambiando algunas opciones avanzadas.

Tipo de modelo de regresiónInterpretaciónFlexibilidad del modelo

Rational Quadratic


DuroAutomático

Squared Exponential


DuroAutomático

Matern 5/2


DuroAutomático

Exponencial


DuroAutomático

En la regresión del proceso Gaussiano, la respuesta se modela utilizando una distribución de probabilidad sobre un espacio de funciones. La flexibilidad de los presets en la galería se elige automáticamente para dar un pequeño error de entrenamiento y, simultáneamente, protección contra sobreajuste.Model Type Para obtener más información sobre la regresión del proceso Gaussiano, consulte.Modelos de regresión de proceso Gaussiano

Sugerencia

Para ver un ejemplo de flujo de trabajo, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Opciones avanzadas de regresión del proceso Gaussiano

Regresión Learner utiliza la función para entrenar modelos GPR.fitrgp

Puede establecer estas opciones en la aplicación:

  • Basis function

    La función base especifica la forma de la función de media anterior del modelo de regresión del proceso Gaussiano. Puede elegir entre Zero, ConstantY Linear. Trate de elegir una función de base diferente y ver si esto mejora su modelo.

  • Kernel function

    La función del kernel determina la correlación en la respuesta como una función de la distancia entre los valores predictores. Puede elegir entre Rational Quadratic, Squared Exponential, Matern 5/2, Matern 3/2Y Exponential.

    Para obtener más información sobre las funciones del kernel, consulte.Opciones de función de kernel (covarianza)

  • Use isotropic kernel

    Si utiliza un kernel isotrópico, las escalas de longitud de correlación son las mismas para todos los predictores. Con un kernel nonisotrópico, cada variable predictora tiene su propia escala de longitud de correlación independiente.

    El uso de un kernel nonisotrópico puede mejorar la precisión de su modelo, pero puede hacer que el modelo sea lento para ajustarse.

    Para obtener más información sobre los kernels nonisotrópicos, consulteOpciones de función del kernel (covarianza).

  • Kernel mode

    Puede especificar manualmente los valores de los parámetros del kernel y.initialKernel scaleSignal standard deviation La desviación estándar de la señal es la desviación estándar anterior de los valores de respuesta. De forma predeterminada, la aplicación optimiza localmente los parámetros del kernel a partir de los valores iniciales. Para utilizar parámetros de kernel fijos, desactive la casilla de verificación en las opciones avanzadas. Optimize numeric parameters

    Cuando se establece enKernel scale mode Auto, la aplicación utiliza un procedimiento heurístico para seleccionar los parámetros iniciales del kernel.

    Si se establece enKernel scale mode Manual, puede especificar los valores iniciales. Haga clic en los botones o introduzca un valor escalar positivo en el cuadro y en el cuadro.Kernel scaleSignal standard deviation

    Si desactiva la casilla de verificación, no podrá establecer los parámetros iniciales del kernel manualmente.Use isotropic kernel

  • Sigma mode

    Puede especificar manualmente el valor de la desviación estándar de ruido de observación.initialSigma Por defecto, la aplicación optimiza la desviación estándar de ruido de observación, comenzando desde el valor inicial. Para utilizar parámetros de kernel fijos, desactive la casilla de verificación en las opciones avanzadas. Optimize numeric parameters

    Cuando se establece enSigma mode Auto, la aplicación utiliza un procedimiento heurístico para seleccionar la desviación estándar de ruido de observación inicial.

    Si se establece enSigma mode Manual, puede especificar los valores iniciales. Haga clic en los botones o escriba un valor escalar positivo en el cuadro.Sigma

  • Standardize

    Estandarizar los predictores los transforma de modo que tengan un medio 0 y una desviación estándar 1. Estandarizar elimina la dependencia de escalas arbitrarias en los predictores y generalmente mejora el rendimiento.

  • Optimize numeric parameters

    Con esta opción, la aplicación optimiza automáticamente los parámetros numéricos del modelo GPR. Los parámetros optimizados son los coeficientes de los parámetros del kernel y la desviación estándar de ruido de observación.Basis functionKernel scaleSignal standard deviationSigma

Conjuntos de árboles

Puede entrenar conjuntos de árboles de regresión en el aprendizaje de regresión. Los modelos de Ensemble combinan resultados de muchos estudiantes débiles en un modelo de conjunto de alta calidad.

Sugerencia

En la galería, haga clic enModel TypeAll Ensemblesprobar cada una de las opciones del conjunto y ver qué configuración produce el mejor modelo con sus datos. Seleccione el mejor modelo en la lista historial e intente mejorar ese modelo utilizando la selección de características y cambiando algunas opciones avanzadas.

Tipo de modelo de regresiónInterpretaciónMétodo EnsembleFlexibilidad del modelo

Boosted Trees


Duro

Boosting de mínimos cuadrados () con alumnos de árbol de regresión.LSBoost

De medio a alto

Bagged Trees


Duro

Bootstrap agregación o embolsado, con los estudiantes de árbol de regresión.

Alto

Sugerencia

Para ver un ejemplo de flujo de trabajo, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Opciones de conjunto avanzado

Regresión Learner utiliza la función para entrenar modelos de conjunto.fitrensemble Puede establecer estas opciones:

  • Minimum leaf size

    Especifique el número mínimo de muestras de formación utilizadas para calcular la respuesta de cada nodo hoja. Cuando crezca un árbol de regresión, tenga en cuenta su simplicidad y poder predictivo. Para cambiar el tamaño mínimo de la hoja, haga clic en los botones o introduzca un valor entero positivo en el cuadro.Minimum leaf size

    • Un árbol fino con muchas hojas pequeñas suele ser muy preciso en los datos de entrenamiento. Sin embargo, es posible que el árbol no muestre una precisión comparable en un conjunto de pruebas independiente. Un árbol muy frondoso tiende a sobreajustarse, y su precisión de validación es a menudo mucho más baja que su precisión de entrenamiento (o reenvío).

    • En contraste, un árbol grueso con menos hojas grandes no alcanza una alta precisión de entrenamiento. Pero un árbol grueso puede ser más robusto en que su precisión de entrenamiento puede estar cerca de la de un conjunto de prueba representativo.

    Sugerencia

    Reduzca el para crear un modelo más flexible.Minimum leaf size

  • Number of learners

    Intente cambiar el número de alumnos para ver si puede mejorar el modelo. Muchos estudiantes pueden producir una alta precisión, pero pueden consumir mucho tiempo para ajustarse.

    Sugerencia

    Aumente el para crear un modelo más flexible.Number of learners

  • Learning rate

    Para los árboles potenciado, especifique la tasa de aprendizaje para la contracción. Si establece la velocidad de aprendizaje en menos de 1, el conjunto requiere más iteraciones de aprendizaje, pero a menudo logra una mejor precisión. 0,1 es una elección inicial popular.

Temas relacionados