Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

predict

Clasifique las observaciones utilizando conjuntos de modelos de clasificación

Descripción

labels = predict(Mdl,X) Devuelve un vector de las etiquetas de clase previstas para los Datos predictores de la tabla o matriz, basándose en el conjunto de clasificación entrenado completo o compacto.XMdl

labels = predict(Mdl,X,Name,Value) utiliza opciones adicionales especificadas por uno o más argumentos de par.Name,Value

[labels,score] = predict(___) también devuelve una matriz de clasificación (), que indica la probabilidad de que una etiqueta proviene de una clase determinada, utilizando cualquiera de los argumentos de entrada en las sintaxis anteriores.PuntuacionesPuntuación Para cada observación en, la etiqueta de clase pronosticada corresponde a la puntuación máxima entre todas las clases.X

Argumentos de entrada

Mdl

Un conjunto de clasificación creado por o un conjunto de clasificación compacta creado porfitcensemble compact.

X

Datos de predictor que se clasificarán, especificados como una matriz o tabla numérica.

Cada fila de corresponde a una observación, y cada columna corresponde a una variable.X

  • Para una matriz numérica:

    • Las variables que componen las columnas de deben tener el mismo orden que las variables predictoras que entrenaron.XMdl

    • Si ha entrenado usando una tabla (por ejemplo,), entonces puede ser una matriz numérica si contiene todas las variables predictoras numéricas.MdlTblXTbl Para tratar los predictores numéricos como categóricos durante el entrenamiento, identifique los predictores categóricos utilizando el argumento de par nombre-valor de.TblCategoricalPredictorsfitcensemble Si contiene variables predictoras heterogéneas (por ejemplo, tipos de datos numéricos y categóricos) y es una matriz numérica, se produce un error.TblXPredecir

  • Para una tabla:

    • no admite variables de varias columnas ni matrices de celdas que no sean matrices de celdas de vectores de caracteres.Predecir

    • Si ha entrenado utilizando una tabla (por ejemplo,), todas las variables predictoras en deben tener los mismos nombres de variable y ser de los mismos tipos de datos que los que entrenaron (almacenados en).MdlTblXMdlMdl.PredictorNames Sin embargo, el orden de columna de no necesita corresponder al orden de columna de. y puede contener variables adicionales (variables de respuesta, pesos de observación, etc.), pero las ignora.XTblTblXPredecir

    • Si entrenó con una matriz numérica, los nombres de los predictores y los nombres de las variables predictoras correspondientes deben ser los mismos.MdlMdl.PredictorNamesX Para especificar nombres de predictores durante el entrenamiento, vea el argumento de par nombre-valor de.PredictorNamesfitcensemble Todas las variables predictoras en deben ser vectores numéricos. puede contener variables adicionales (variables de respuesta, pesos de observación, etc.), pero las ignora.XXPredecir

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

'Learners'

Los índices de los estudiantes débiles utilizan para el cálculo de las respuestas, un vector numérico.Predecir

Predeterminado: , ¿Dónde está el número de estudiantes débiles en1:TTMdl

'UseObsForLearner'

Una matriz lógica de tamaño por-, donde:NT

  • es el número de filas de.NX

  • es el número de estudiantes débiles en.TMdl

Cuando es, el alumno se usa para predecir la clase de fila de.UseObsForLearner(i,j)truejiX

Predeterminado: true(N,T)

Argumentos de salida

labels

Vector de etiquetas de clasificación. tiene el mismo tipo de datos que las etiquetas utilizadas en el entrenamiento.labelsMdl (The software treats string arrays as cell arrays of character vectors.)

score

Una matriz con una fila por observación y una columna por clase. Para cada observación y cada clase, la puntuación generada por cada árbol es la probabilidad de esta observación procedente de esta clase calculada como la fracción de observaciones de esta clase en una hoja de árbol. promedios de estas puntuaciones sobre todos los árboles en el conjunto.Predecir

Ejemplos

expandir todo

Cargue el conjunto de datos de iris de Fisher. Determine el tamaño de la muestra.

load fisheriris N = size(meas,1);

Particionar los datos en conjuntos de entrenamiento y pruebas. Mantenga el 10% de los datos para las pruebas.

rng(1); % For reproducibility cvp = cvpartition(N,'Holdout',0.1); idxTrn = training(cvp); % Training set indices idxTest = test(cvp);    % Test set indices

Almacene los datos de entrenamiento en una tabla.

tblTrn = array2table(meas(idxTrn,:)); tblTrn.Y = species(idxTrn);

Entrena un conjunto de clasificación usando AdaBoostM2 y el conjunto de entrenamiento. Especifique los tocones de árbol como los alumnos débiles.

t = templateTree('MaxNumSplits',1); Mdl = fitcensemble(tblTrn,'Y','Method','AdaBoostM2','Learners',t);

Predecir etiquetas para el conjunto de pruebas. Ha entrenado el modelo mediante una tabla de datos, pero puede predecir etiquetas mediante una matriz.

labels = predict(Mdl,meas(idxTest,:));

Construya una matriz de confusión para el conjunto de pruebas.

confusionchart(species(idxTest),labels);

clasifica erróneamente un Iris versicolor como virginica en el conjunto de pruebas.Mdl

Más acerca de

expandir todo

Capacidades ampliadas

Introducido en R2011a