Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Evalúe el rendimiento del modelo en aprendizaje de regresión

Después de entrenar modelos de regresión en el aprendizaje de regresión, puede comparar modelos basados en estadísticas del modelo, visualizar los resultados en el trazado de respuesta o trazar la respuesta real frente a la predicción y evaluar los modelos utilizando el trazado residual.

  • Si utiliza la validación cruzada, la aplicación computa las estadísticas del modelo utilizando las observaciones de los pliegues de validación y notifica los valores medios.kk Realiza predicciones sobre las observaciones en los pliegues de validación y las gráficas muestran estas predicciones. También calcula los residuos en las observaciones de los pliegues de validación.

    Nota

    Al importar datos en la aplicación, si acepta los valores predeterminados, la aplicación usa automáticamente la validación cruzada. Para obtener más información, consulte.Elija esquema de validación

  • Si usa la validación de exclusión, la aplicación calcula las puntuaciones de precisión utilizando las observaciones del pliegue de validación y realiza predicciones sobre estas observaciones. La aplicación usa estas predicciones en los trazados y también calcula los residuales en función de las predicciones.

  • Si decide no usar un esquema de validación, la puntuación es la precisión de la presentación en función de todos los datos de entrenamiento y las predicciones son predicciones de reenvío.

Comprobar rendimiento en la lista de historial

Después de entrenar un modelo en el aprendizaje de regresión, Compruebe la lista historial para ver qué modelo tiene la mejor puntuación general. La mejor puntuación se resalta en una caja. Esta puntuación es el error cuadrcular medio (RMSE) en el conjunto de validación. La puntuación estima el rendimiento del modelo entrenado en los nuevos datos. Utilice la partitura para ayudarle a elegir el mejor modelo.

  • Para la validación cruzada, la puntuación es el RMSE en todas las observaciones, contando cada observación cuando estaba en un pliegue retenido.

  • Para la validación de exclusión, la puntuación es el RMSE en las observaciones mantenidas.

  • Para ninguna validación, la puntuación es el RMSE de reenvío en todos los datos de entrenamiento.

La mejor puntuación general podría no ser el mejor modelo para su objetivo. A veces un modelo con una puntuación general ligeramente más baja es el mejor modelo para su objetivo. Desea evitar el sobreajuste, y es posible que desee excluir algunos predictores donde la recopilación de datos es costosa o difícil.

Ver estadísticas del modelo en la ventana modelo actual

Puede ver las estadísticas del modelo en la ventana modelo actual y utilizar estas estadísticas para evaluar y comparar modelos. Las estadísticas se calculan en el conjunto de validación.

Estadísticas del modelo

EstadísticaDescripciónPropina
RmseRaíz error cuadrado medio. El RMSE siempre es positivo y sus unidades coinciden con las unidades de su respuesta.Busque valores más pequeños del RMSE.
R-squaredCoeficiente de determinación. R cuadrado es siempre más pequeño que 1 y por lo general más grande que 0. Compara el modelo entrenado con el modelo donde la respuesta es constante y equivale a la media de la respuesta de entrenamiento. Si su modelo es peor que este modelo constante, entonces R-squared es negativo.Busque un R cuadrado cerca de 1.
MseError cuadrado medio. El MSE es el cuadrado del RMSE.Busque los valores más pequeños del MSE.
MaeError absoluto medio. El MAE siempre es positivo y similar al RMSE, pero menos sensible a los valores atípicos.Busque valores más pequeños del MAE.

Explore datos y resultados en gráfica de respuesta

En la gráfica de respuesta, vea los resultados del modelo de regresión. Después de entrenar un modelo de regresión, la gráfica de respuesta muestra la respuesta pronosticada en comparación con el número de registro. Si utiliza la exclusión o la validación cruzada, estas predicciones son las predicciones de las observaciones de las que se mantienen. En otras palabras, cada predicción se obtiene utilizando un modelo que fue entrenado sin utilizar la observación correspondiente. Para investigar los resultados, utilice los controles de la derecha. Puedes:

  • Trazar las respuestas predichas y/o verdaderas. Utilice las casillas de verificación debajo para realizar la selección.Plot

  • Mostrar errores de predicción, dibujados como líneas verticales entre las respuestas pronosticadas y verdaderas, activando la casilla de verificación.Errors

  • Elija la variable que desea trazar en el eje.xX-axis Puede elegir el número de registro o una de las variables predictoras.

  • Trace la respuesta como marcadores o como un diagrama de caja bajo.Style Sólo se puede seleccionar cuando la variable en el eje tiene pocos valores únicos.Box plotx

    Un diagrama de caja muestra los valores típicos de la respuesta y cualquier valor atípicos posible. La marca central indica la mediana, y los bordes inferior y superior de la caja son los percentiles 25º y 75, respectivamente. Las líneas verticales, llamadas bigotes, se extienden desde las cajas hasta los puntos de datos más extremos que no se consideran valores atípicos. Los valores atípicos se trazan individualmente mediante el símbolo.'+' Para obtener más información sobre los trazados de caja, consulte.boxplot

Para exportar los diagramas de respuesta que cree en la aplicación a las cifras, consulte.Exportar trazados en aplicación de regresión Learner

Trama prevista frente a respuesta real

Utilice la gráfica pronosticada frente a real para comprobar el rendimiento del modelo. Utilice esta gráfica para comprender qué tan bien el modelo de regresión realiza predicciones para diferentes valores de respuesta. Para ver la gráfica pronosticada frente a real después de entrenar un modelo, en la pestaña, en la sección, haga clic enEl aprendiz de regresiónPlotsPredicted vs. Actual Plot.

Al abrir el trazado, la respuesta pronosticada del modelo se traza con la respuesta real verdadera. Un modelo de regresión perfecto tiene una respuesta pronosticada igual a la respuesta verdadera, por lo que todos los puntos se encuentran en una línea diagonal. La distancia vertical desde la línea hasta cualquier punto es el error de la predicción para ese punto. Un buen modelo tiene pequeños errores, por lo que las predicciones se dispersan cerca de la línea.

Por lo general, un buen modelo tiene puntos dispersos aproximadamente simétricamente alrededor de la línea diagonal. Si puede ver patrones claros en la gráfica, es probable que pueda mejorar su modelo. Intente entrenar un tipo de modelo diferente o hacer que su tipo de modelo actual sea más flexible usando las opciones de la sección.AdvancedModel Type Si no puede mejorar el modelo, es posible que necesite más datos o que le falte un predictor importante.

Para exportar las parcelas pronosticadas frente a las reales que cree en la aplicación a las cifras, consulte.Exportar trazados en aplicación de regresión Learner

Evaluar modelo mediante la gráfica de residuos

Utilice la gráfica de residuos para comprobar el rendimiento del modelo. Para ver el trazado de residuos después de entrenar un modelo, en la pestaña, en la sección, haga clic enEl aprendiz de regresiónPlotsResiduals Plot. El trazado de residuos muestra la diferencia entre las respuestas pronosticadas y verdaderas. Elija la variable que desea trazar en el eje.xX-axis Elija la respuesta real, la respuesta pronosticada, el número de registro o uno de sus predictores.

Por lo general, un buen modelo tiene residuos dispersos aproximadamente simétricamente alrededor de 0. Si puede ver patrones claros en los residuos, es probable que pueda mejorar su modelo. Busque estos patrones:

  • Los residuos no se distribuyen simétricamente alrededor de 0.

  • Los residuos cambian significativamente de tamaño de izquierda a derecha en la gráfica.

  • Los valores atípicos se producen, es decir, los residuales que son mucho más grandes que el resto de los residuales.

  • El patrón no lineal claro aparece en los residuos.

Intente entrenar un tipo de modelo diferente o hacer que su tipo de modelo actual sea más flexible usando las opciones de la sección.AdvancedModel Type Si no puede mejorar el modelo, es posible que necesite más datos o que le falte un predictor importante.

Para exportar los trazados de residuos que cree en la aplicación a las cifras, consulte.Exportar trazados en aplicación de regresión Learner

Temas relacionados