Main Content

Classification Learner

Entrenar modelos para clasificar datos usando machine learning supervisado

Descripción

La app Classification Learner entrena modelos para clasificar datos. Con esta app, puede explorar el proceso de machine learning supervisado mediante varios clasificadores. Puede explorar los datos, seleccionar características, especificar esquemas de validación, entrenar modelos y evaluar los resultados. Puede llevar a cabo entrenamiento automatizado para buscar el mejor tipo de modelo de clasificación, incluyendo árboles de decisión, análisis discriminantes, máquinas de vectores de apoyo, regresión logística, vecinos más próximos, Naive Bayes, aproximación de kernel, ensemble y clasificación de redes neuronales.

Puede llevar a cabo procesos de machine learning supervisados facilitando un conjunto de datos de entrada conocidos (observaciones o ejemplos) y respuestas conocidas a los datos (etiquetas o clases). Utilice los datos para entrenar un modelo que genera predicciones que responden a nuevos datos. Para usar el modelo con datos nuevos, o para obtener más información sobre la clasificación programática, puede exportar el modelo al área de trabajo o generar código MATLAB® para recrear el modelo entrenado.

Sugerencia

Para empezar, en la lista Classifier, pruebe All Quick-To-Train para entrenar una selección de modelos. Consulte Automated Classifier Training.

Productos necesarios

  • MATLAB

  • Statistics and Machine Learning Toolbox™

Classification Learner app

Abrir la aplicación Classification Learner

  • Barra de herramientas de MATLAB: En la pestaña Apps, en Machine Learning, haga clic en el icono de la app.

  • Línea de comandos de MATLAB: Introduzca classificationLearner.

Uso programático

expandir todo

classificationLearner abre la app Classification Learner o la trae al frente si ya se ha abierto.

classificationLearner(Tbl,ResponseVarName) abre la app Classification Learner y rellena el cuadro de diálogo New Session from Arguments con los datos que contiene la tabla Tbl. El argumento ResponseVarName, especificado como vector de caracteres o escalar de cadena, es el nombre de la variable de respuesta de Tbl que contiene las etiquetas de clase. La variable de respuesta no puede contener más de 500 etiquetas de clase únicas. Las variables restantes de Tbl son las variables predictoras.

classificationLearner(Tbl,Y) abre la app Classification Learner y rellena el cuadro de diálogo New Session from Arguments con las variables predictoras de la tabla Tbl y las etiquetas de clase del vector Y. Puede especificar la respuesta Y como arreglo categórico, arreglo de caracteres, arreglo de cadenas, vector lógico, vector numérico o arreglo de celdas de vectores de caracteres. Y no puede contener más de 500 etiquetas de clase únicas.

classificationLearner(X,Y) abre la app Classification Learner y rellena el cuadro de diálogo New Session from Arguments con la matriz predictora X de n por p y las etiquetas de clase n del vector Y. Cada fila de X corresponde a una observación y cada columna, a una variable. La longitud de Y y el número de filas de X deben ser iguales. Y no puede contener más de 500 etiquetas de clase únicas.

classificationLearner(___,Name,Value) especifica opciones de validación cruzada usando uno o varios de los siguientes argumentos nombre-valor, además de cualquier combinación de los argumentos de entrada de las sintaxis anteriores. Por ejemplo, puede especificar "KFold",10 para utilizar un esquema de validación cruzada de 10 particiones.

  • "CrossVal", especificada como "on" (predeterminado) o "off", es el indicador de la validación cruzada. Si especifica "on", entonces la app utiliza una validación cruzada de 5 particiones. Si especifica "off", entonces la app utiliza una validación por sustitución.

    Puede eliminar el ajuste de la validación cruzada de "CrossVal" usando el argumento de nombre-valor "Holdout" o "KFold". Solo puede especificar uno de estos argumentos a la vez.

  • "Holdout", especificado como escalar numérico en el intervalo [0.05,0.5], es la fracción de datos usada para la validación por retención. La app utiliza los datos restantes para el entrenamiento (y las pruebas, si se especifica).

  • "KFold", especificado como entero positivo en el intervalo [2,50], es el número de particiones que se usarán en la validación cruzada.

  • "TestDataFraction", especificado como escalar numérico en el intervalo [0,0.5], es la fracción de datos reservada para las pruebas.

classificationLearner(filename) abre la app Classification Learner con la sesión previamente guardada en filename. El argumento de filename, especificado como vector de caracteres o escalar de cadena, debe incluir el nombre de un archivo de sesión de Classification Learner y la ruta del archivo, si no está en la carpeta actual. El archivo debe tener la extensión .mat.

Limitaciones

  • Classification Learner no es compatible con el despliegue de modelos a MATLABProduction Server™ en MATLABOnline™.

Historial de versiones

Introducido en R2015a