Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Entrenar árboles de regresión utilizando la aplicación de regresión Learner

En este ejemplo se muestra cómo crear y comparar varios árboles de regresión con la aplicación regresión Learner y exportar modelos entrenados al área de trabajo para realizar predicciones para nuevos datos.

Puede entrenar árboles de regresión para predecir las respuestas a los datos de entrada dados. Para predecir la respuesta de un árbol de regresión, siga el árbol desde el nodo raíz (principio) hasta un nodo hoja. En cada nodo, decida qué rama seguir utilizando la regla asociada a ese nodo. Continúe hasta que llegue a un nodo hoja. La respuesta pronosticada es el valor asociado a ese nodo hoja.

árboles son binarios.Statistics and Machine Learning Toolbox™ Cada paso de una predicción implica comprobar el valor de una variable predictora. Por ejemplo, aquí hay un árbol de regresión simple:

Este árbol predice la respuesta basada en dos predictores y.x1x2 Para predecir, comience en el nodo superior. En cada nodo, compruebe los valores de los predictores para decidir qué rama seguir. Cuando las ramas alcanzan un nodo hoja, la respuesta se establece en el valor correspondiente a ese nodo.

En este ejemplo se utiliza el conjunto de datos.carbig Este conjunto de datos contiene características de diferentes modelos de automóviles producidos de 1970 a 1982, incluyendo:

  • Aceleración

  • Número de cilindros

  • El desplazamiento del motor

  • Potencia del motor (potencia)

  • Año modelo

  • País de origen

  • Millas por galón (MPG)

Entrenar árboles de regresión para predecir la economía de combustible en millas por galón de un modelo de coche, dadas las otras variables como entradas.

  1. En, cargue el conjunto de datos y cree una tabla que contenga las diferentes variables:MATLAB®carbig

    load carbig cartable = table(Acceleration, Cylinders, Displacement,... Horsepower, Model_Year, Weight, Origin, MPG);
  2. En la pestaña, en el grupo, haga clic en.AppsMachine LearningEl aprendiz de regresión

  3. En la pestaña, haga clic y seleccione.El aprendiz de regresiónNew SessionFrom Workspace

  4. En el cuadro de diálogo nueva sesión, seleccione en la lista de tablas y matrices del área de trabajo.Workspace Variablecartable

    Observe que la aplicación ha preseleccionado la respuesta y las variables predictoras. se elige como la respuesta, y todas las otras variables como predictores.MPG Para este ejemplo, no cambie las selecciones.

  5. Para aceptar el esquema de validación predeterminado y continuar, haga clic en.Start Session La opción de validación predeterminada es la validación cruzada, para protegerse contra el sobreajuste.

    El aprendizaje de regresión crea un gráfico de la respuesta con el número de registro en el eje.x

  6. Utilice la gráfica de respuesta para investigar qué variables son útiles para predecir la respuesta. Para visualizar la relación entre los diferentes predictores y la respuesta, seleccione diferentes variables en la lista debajo.XX-axis

    Observe qué variables se correlacionan más claramente con la respuesta. , y todos tienen un impacto claramente visible en la respuesta y todos muestran una asociación negativa con la respuesta.DisplacementHorsepowerWeight

  7. Seleccione la variable debajo.OriginX-axis Se visualiza automáticamente un diagrama de caja. Un diagrama de caja muestra los valores típicos de la respuesta y cualquier valor atípicos posible. El diagrama de caja es útil cuando los marcadores de trazado se superponen en muchos puntos. Para mostrar un diagrama de caja cuando la variable en el eje tiene pocos valores únicos, debajo, seleccione.xStyleBox plot

  8. Cree una selección de árboles de regresión. En la pestaña, en la sección, haga clic enRegression LearnerModel TypeAll Trees .

    A continuación, haga clicTrain .

    Sugerencia

    Si lo tiene, la primera vez que haga clic verá un cuadro de diálogo mientras la aplicación abre un grupo paralelo de trabajadores.Parallel Computing Toolbox™Train Después de que se abra el grupo, puede entrenar varios modelos de regresión simultáneamente y continuar trabajando.

    El aprendiz de regresión crea y entrena tres árboles de regresión: a, a y a.Fine TreeMedium TreeCoarse Tree

    Los tres modelos aparecen en la lista historial. Compruebe la validación (error cuadrcular medio) de los modelos.RMSE La mejor puntuación se resalta en una caja.

    El y el tienen RMSEs similares, mientras que el es menos preciso.Fine TreeMedium TreeCoarse Tree

    El alumno de regresión traza tanto la respuesta de entrenamiento real como la respuesta pronosticada del modelo actualmente seleccionado.

    Nota

    Si usa la validación, hay cierta aleatoriedad en los resultados y, por tanto, la puntuación de validación del modelo puede diferir de los resultados mostrados.

  9. Elija un modelo en la lista historial para ver los resultados de ese modelo. En, seleccione y examine la gráfica de respuesta.X-axisHorsepower Ahora se trazan las respuestas verdaderas y pronosticadas. Mostrar los errores de predicción, dibujados como líneas verticales entre las respuestas pronosticadas y verdaderas, activando la casilla de verificación.Errors

  10. Vea más detalles sobre el modelo actualmente seleccionado en la ventana modelo actual. Compruebe y compare las características adicionales del modelo, como R-cuadrado (coeficiente de determinación), MAE (error absoluto medio) y velocidad de predicción. Para obtener más información, consulte.Ver estadísticas del modelo en la ventana modelo actual En la ventana modelo actual también puede encontrar detalles sobre el tipo de modelo actualmente seleccionado, como las opciones utilizadas para entrenar el modelo.

  11. Trace la respuesta pronosticada frente a la respuesta verdadera. En la pestaña, en la sección, haga clic enRegression LearnerPlotsPredicted vs. Actual Plot . Utilice esta gráfica para comprender qué tan bien el modelo de regresión realiza predicciones para diferentes valores de respuesta.

    Un modelo de regresión perfecto ha pronosticado una respuesta igual a la respuesta verdadera, por lo que todos los puntos se encuentran en una línea diagonal. La distancia vertical desde la línea hasta cualquier punto es el error de la predicción para ese punto. Un buen modelo tiene pequeños errores, por lo que las predicciones se dispersan cerca de la línea. Por lo general, un buen modelo tiene puntos dispersos aproximadamente simétricamente alrededor de la línea diagonal. Si puede ver patrones claros en la gráfica, es probable que pueda mejorar su modelo.

  12. Seleccione los otros modelos en la lista historial y compare los trazados previstos y reales.

  13. En la galería, seleccione de nuevo.Model TypeAll Trees Para intentar mejorar el modelo, intente incluir diferentes características en el modelo. Vea si puede mejorar el modelo eliminando características con baja potencia predictiva. En la pestaña, en la sección, haga clic enRegression LearnerFeaturesSelección de características.

    En la ventana selección de características, desactive las casillas de verificación y para excluirlas de los predictores.AccelerationCylinders

    Haga clicTrain para entrenar nuevos árboles de regresión utilizando la nueva configuración de predictor.

  14. Observe los nuevos modelos en la lista de historial. Estos modelos son los mismos árboles de regresión que antes, pero entrenados usando sólo cinco de siete predictores. La lista historial muestra cuántos predictores se utilizan. Para comprobar qué predictores se utilizan, haga clic en un modelo en la lista historial y observe las casillas de verificación en la ventana selección de características.

    Los modelos con las dos características eliminadas se realizan de forma comparable a los modelos que utilizan todos los predictores. Los modelos no predicen mejor utilizando todos los predictores en comparación con el uso de sólo un subconjunto de los predictores. Si la recopilación de datos es costosa o difícil, es posible que prefiera un modelo que se realice satisfactoriamente sin algunos predictores.

  15. Entrenar los tres presets de árbol de regresión utilizando sólo como predictor.Horsepower Cambie las selecciones en la ventana selección de características y haga clic en.Train

    Utilizando sólo la potencia del motor como predictor resulta en modelos con menor precisión. Sin embargo, los modelos funcionan bien dado que están utilizando sólo un predictor único. Con este simple espacio predictor unidimensional, el árbol grueso ahora se comporta así como los árboles medianos y finos.

  16. Seleccione el mejor modelo en la lista historial y visualice el trazado de residuos. En la pestaña, en la sección, haga clic enEl aprendiz de regresiónPlotsResiduals Plot. El trazado de residuos muestra la diferencia entre las respuestas pronosticadas y verdaderas. Para mostrar los residuos como un gráfico de líneas, en la sección, elija.StyleLines

    En, seleccione la variable que desea trazar en el eje.X-axisx Elija la respuesta real, la respuesta pronosticada, el número de registro o uno de sus predictores.

    Por lo general, un buen modelo tiene residuos dispersos aproximadamente simétricamente alrededor de 0. Si puede ver patrones claros en los residuos, es probable que pueda mejorar su modelo.

  17. Para obtener más información sobre la configuración del modelo, elija el mejor modelo en la lista historial y vea la configuración avanzada. Las opciones de la galería son puntos de partida preestablecidos y puede cambiar la configuración adicional.Model Type En la pestaña, en la sección, haga clic en.El aprendiz de regresiónModel TypeAdvanced Compare los diferentes modelos de árbol de regresión en la lista historial y observe las diferencias en el cuadro de diálogo Opciones avanzadas del árbol de regresión. La configuración controla el tamaño de las hojas del árbol y, a través de ella, el tamaño y la profundidad del árbol de regresión.Minimum leaf size

    Para intentar mejorar aún más el modelo, cambie la configuración a 8 y, a continuación, entrenar un nuevo modelo haciendo clic en.Minimum leaf sizeTrain

    Vea la configuración del modelo entrenado seleccionado en la ventana modelo actual o en el cuadro de diálogo Opciones avanzadas del árbol de regresión.

    Para obtener más información sobre la configuración del árbol de regresión, consulte.Los árboles de regresión

  18. Exporte el modelo seleccionado al espacio de trabajo. En la pestaña, en la sección, haga clic en.Regression LearnerExportExport Model En el cuadro de diálogo Exportar modelo, haga clic para aceptar el nombre de variable predeterminado.OKtrainedModel

    Para ver información sobre los resultados, busque en la ventana de comandos.

  19. Utilice el modelo exportado para realizar predicciones sobre nuevos datos. Por ejemplo, para realizar predicciones para los datos en el área de trabajo, escriba: la salida contiene la respuesta pronosticada para cada punto de datos.cartable

    yfit = trainedModel.predictFcn(cartable)
    yfit

  20. Si desea automatizar el entrenamiento del mismo modelo con nuevos datos o aprender a entrenar modelos de regresión mediante programación, puede generar código desde la aplicación. Para generar código para el modelo mejor entrenado, en la pestaña, en la sección, haga clic en.Regression LearnerExportGenerate Function

    La aplicación genera código a partir del modelo y muestra el archivo en el editor.MATLAB Para obtener más información, consulte.Generar código para entrenar modelo con nuevos datosMATLAB

Sugerencia

Utilice el mismo flujo de trabajo que en este ejemplo para evaluar y comparar los otros tipos de modelo de regresión que puede entrenar en el aprendizaje de regresión.

Entrenar todos los presets del modelo de regresión disponibles:

  1. En el extremo derecho de la sección, haga clic en la flecha para expandir la lista de modelos de regresión.Model Type

  2. Haga clicAlly, a continuación, haga clic.Train

Para obtener información sobre otros tipos de modelos de regresión, consulte.Entrenar modelos de regresión en la aplicación de regresión Learner

Temas relacionados