Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Selección de características y transformación de características mediante la aplicación de regresión Learner

Investigar entidades en el diagrama de respuesta

En aprendizaje de regresión, utilice la gráfica de respuesta para intentar identificar los predictores que son útiles para predecir la respuesta. Para visualizar la relación entre los diferentes predictores y la respuesta, en, seleccione diferentes variables en la lista.X-axisX

Antes de entrenar un modelo de regresión, la gráfica de respuesta muestra los datos de entrenamiento. Si ha entrenado un modelo de regresión, la gráfica de respuesta también muestra las predicciones del modelo.

Observe qué variables están asociadas más claramente con la respuesta. Al trazar el conjunto de datos, el predictor muestra una asociación negativa clara con la respuesta.carbigHorsepower

Busque características que no parecen tener ninguna asociación con la respuesta y el usoSelección de característicaspara eliminar esas características del conjunto de predictores usados.

Puede exportar los trazados de respuesta que cree en la aplicación a las cifras. Ver.Exportar trazados en aplicación de regresión Learner

Seleccione características para incluir

En el aprendizaje de regresión, puede especificar diferentes características (o predictores) que se incluirán en el modelo. Vea si puede mejorar los modelos eliminando características con baja potencia predictiva. Si la recopilación de datos es costosa o difícil, es posible que prefiera un modelo que funcione satisfactoriamente con menos predictores.

  1. En la pestaña, en la sección, haga clic enEl aprendiz de regresiónFeaturesFeature Selection.

  2. En la ventana selección de características, desactive las casillas de verificación de los predictores que desee excluir.

    Sugerencia

    Puede cerrar la ventana selección de características o moverla. Las opciones que se hacen en la ventana permanecen.

  3. Haga clic para entrenar un nuevo modelo utilizando las nuevas opciones de predictor.Train

  4. Observe el nuevo modelo en la lista historial. La ventana modelo actual muestra cuántos predictores se excluyen.

  5. Compruebe qué predictores se incluyen en un modelo entrenado. Haga clic en el modelo en la lista historial y mire las casillas de verificación en la ventana selección de características.

  6. Trate de mejorar el modelo mediante la inclusión de diferentes características.

Para obtener un ejemplo con la selección de características, consulte.Entrenar árboles de regresión utilizando la aplicación de regresión Learner

Transforme las entidades con PCA en el aprendizaje de regresión

Utilice el análisis de componentes principales (PCA) para reducir la dimensionalidad del espacio predictor. La reducción de la dimensionalidad puede crear modelos de regresión en el aprendizaje de regresión que ayudan a evitar el sobreajuste. El PCA transforma linealmente los predictores para quitar las dimensiones redundantes, y genera un nuevo conjunto de las variables llamadas los componentes principales.

  1. En la pestaña, en la sección, seleccione.El aprendiz de regresiónFeaturesPCA

  2. En la ventana Opciones avanzadas de PCA, seleccione la casilla de verificación.Enable PCA

    Puede cerrar la ventana PCA o moverla. Las opciones que se hacen en la ventana permanecen.

  3. Haga clic de nuevo.Train La función transforma las entidades seleccionadas antes de entrenar el modelo.pca

    Por abandono, el PCA guarda solamente los componentes que explican el 95% de la varianza. En la ventana PCA, puede cambiar el porcentaje de varianza que se explicará en la casilla.Explained variance Un valor más alto arriesga el sobreajuste, mientras que un valor más bajo corre el riesgo de eliminar dimensiones útiles.

  4. Limite manualmente el número de componentes PCA. En la lista, seleccioneComponent reduction criterion Specify number of components. Edite el número en el cuadro.Number of numeric components El número de componentes no puede ser mayor que el número de predictores numéricos. El PCA no se aplica a los predictores categóricos.

Puede comprobar opciones de PCA para modelos entrenados en la ventana modelo actual. Por ejemplo: Compruebe los porcentajes de desviación explicados para decidir si desea cambiar el número de componentes.

PCA is keeping enough components to explain 95% variance.  After training, 2 components were kept.  Explained variance per component (in order): 92.5%, 5.3%, 1.7%, 0.5%

Para obtener más información sobre cómo el aprendizaje de regresión aplica PCA a los datos, genere código para el modelo de regresión entrenado. Para más información sobre el PCA, vea la función.pca

Temas relacionados