Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Selección de características y transformación de características mediante la aplicación clasificación del alumno

Investigar entidades en el gráfico de dispersión

En el aprendizaje de clasificación, intente identificar los predictores que separan las clases bien trazando diferentes pares de predictores en el gráfico de dispersión. La gráfica puede ayudarle a investigar características para incluirlas o excluirlas. Puede visualizar los datos de entrenamiento y los puntos clasificados erróneamente en el gráfico de dispersión.

Antes de entrenar un clasificador, el gráfico de dispersión muestra los datos. Si ha entrenado un clasificador, el gráfico de dispersión muestra los resultados de la predicción del modelo. Cambie a trazar solo los datos seleccionando en los controles.DatosPlot

  • Elija operaciones para trazar utilizando las listas y debajo.XYPredictors

  • Busque predictores que separan las clases bien. Por ejemplo, trazar los datos, se puede ver que la longitud del sépalo y la anchura del sépalo separan una de las clases Well ().fisheririssetosa Debe trazar otros predictores para ver si puede separar las otras dos clases.

  • Mostrar u ocultar clases específicas mediante las casillas de verificación debajo.Show

  • Para cambiar el orden de apilamiento de las clases trazadas, seleccione una clase y, a continuación, haga clic en.ClassesMove to Front

  • Investigue detalles más finos ampliando y desplazando el gráfico a través del trazado. Para habilitar el zoom y la panorámica, desplace el ratón sobre el gráfico de dispersión y haga clic en uno de los botones que aparecen cerca de la esquina superior derecha del trazado.

  • Si identifica los predictores que no son útiles para separar las clases, intente usar para eliminarlos y entrenar clasificadores, incluidos solo los predictores más útiles.Selección de características

Después de entrenar un clasificador, el gráfico de dispersión muestra los resultados de la predicción del modelo. Puede mostrar u ocultar resultados correctos o incorrectos y visualizar los resultados por clase. Ver.Resultados del clasificador de trazado

Puede exportar los diagramas de dispersión que cree en la aplicación a las figuras. Ver.Exportar trazados en la aplicación de aprendizaje de clasificación

Seleccione características para incluir

En el aprendizaje de clasificación, puede especificar diferentes características (o predictores) que se incluirán en el modelo. Vea si puede mejorar los modelos eliminando características con baja potencia predictiva. Si la recopilación de datos es costosa o difícil, es posible que prefiera un modelo que se realice satisfactoriamente sin algunos predictores.

  1. En la pestaña, en la sección, haga clic en.El alumno de clasificaciónFeaturesFeature Selection

  2. En la ventana de desmontaje de la selección de características, desactive las casillas de verificación de los predictores que desea excluir.

    Sugerencia

    Puede cerrar la ventana de desmontaje de la selección de características o moverla. Sus opciones en el desmontaje permanecen.

  3. Haga clic para entrenar un nuevo modelo utilizando las nuevas opciones de predictor.Train

  4. Observe el nuevo modelo en la lista historial. El panel modelo actual muestra cuántos predictores se excluyen.

  5. Para comprobar qué predictores se incluyen en un modelo entrenado, haga clic en el modelo en la lista historial y observe las casillas de verificación en el cuadro de diálogo Selección de características.

  6. Puede intentar mejorar el modelo mediante la inclusión de diferentes características en el modelo.

Para obtener un ejemplo con la selección de características, consulte.Entrenar árboles de decisión mediante la aplicación de clasificación aprendiz

Transformar entidades con PCA en clasificación Learner

Utilice el análisis de componentes principales (PCA) para reducir la dimensionalidad del espacio predictor. La reducción de la dimensionalidad puede crear modelos de clasificación en el aprendizaje de clasificación que ayudan a evitar el sobreajuste. El PCA transforma linealmente los predictores para quitar las dimensiones redundantes, y genera un nuevo conjunto de las variables llamadas los componentes principales.

  1. En la pestaña, en la sección, seleccione.El alumno de clasificaciónFeaturesPCA

  2. En la ventana de desmontaje opciones avanzadas de PCA, seleccione la casilla de verificación.Enable PCA

    Puede cerrar la ventana de desmontaje de la PCA o moverla. Sus opciones en el desmontaje permanecen.

  3. Al hacer clic a continuación, la función transforma las entidades seleccionadas antes de entrenar el clasificador.Trainpca

  4. Por abandono, el PCA guarda solamente los componentes que explican el 95% de la varianza. En la ventana de desmontaje de PCA, puede cambiar el porcentaje de varianza que se explicará en el cuadro.Explained variance Un valor más alto arriesga el sobreajuste, mientras que un valor más bajo corre el riesgo de eliminar dimensiones útiles.

  5. Si desea limitar manualmente el número de componentes de PCA, en la lista, seleccioneComponent reduction criterion Specify number of components. Edite el número en el cuadro.Number of numeric components El número de componentes no puede ser mayor que el número de predictores numéricos. El PCA no se aplica a los predictores categóricos.

Compruebe las opciones de PCA para modelos entrenados en la información del panel modelo actual. Compruebe los porcentajes de desviación explicados para decidir si desea cambiar el número de componentes. Por ejemplo:

PCA is keeping enough components to explain 95% variance.  After training, 2 components were kept.  Explained variance per component (in order): 92.5%, 5.3%, 1.7%, 0.5%

Para obtener más información sobre cómo el alumno de clasificación aplica PCA a los datos, genere código para el clasificador entrenado. Para más información sobre el PCA, vea la función.pca

Investigar entidades en el trazado de coordenadas paralelas

Para investigar las entidades que se incluirán o excluirán, utilice el trazado de coordenadas paralelas. Puede visualizar datos de alta cota en una única gráfica para ver los patrones 2D. Esta gráfica puede ayudarle a comprender las relaciones entre las entidades e identificar predictores útiles para separar las clases. Puede visualizar los datos de entrenamiento y los puntos mal clasificados en el trazado de coordenadas paralelas. Al trazar los resultados del clasificador, los puntos clasificados erróneamente muestran líneas discontinuas.

  1. En la pestaña, en la sección, seleccione.El alumno de clasificaciónPlotsParallel Coordinates Plot

  2. En la gráfica, puede arrastrar las barras para reordenar los predictores. Cambiar el orden puede ayudarle a identificar predictores que separan las clases bien.

  3. Para especificar los predictores que se trazan, utilice las casillas de verificación.Predictors Puede ser útil trazar algunos predictores a la vez. Si los datos tienen muchos predictores, la gráfica muestra los primeros 10 de forma predeterminada.

  4. Si los predictores tienen escalas muy diferentes, escale los datos para que sea más fácil visualizarlos. Pruebe diferentes opciones en la lista:Scaling

    • Normalization traza todos los predictores en el mismo rango de 0 a 1.

    • Standardization traza la media de cada predictor a cero y escala los predictores por sus desviaciones estándar.

  5. Si identifica predictores que no son útiles para separar clases, utilítelos para eliminarlos y entrenar clasificadores, incluidos solo los predictores más útiles.Selección de características

Al trazar los datos, puede ver que la longitud del pétalo y el ancho del pétalo son las entidades que separan mejor las clases.fisheriris

Puede exportar las gráficas de coordenadas paralelas que cree en la aplicación a las figuras. Ver.Exportar trazados en la aplicación de aprendizaje de clasificación

Temas relacionados