Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

resubMargin

Clase: ClassificationNaiveBayes

Márgenes de clasificación de los clasificadores Bayes ingenuos mediante la representación

Descripción

ejemplo

m = resubMargin(Mdl) Devuelve el reenviarlo () para el clasificador Bayes Ingenuo utilizando los datos de entrenamiento almacenados en y las etiquetas de clase correspondientes almacenadas en.márgenes de clasificaciónmMdlMdl.XMdl.Y

Argumentos de entrada

expandir todo

Un clasificador Bayes Ingenuo completamente entrenado, especificado como un modelo entrenado por.ClassificationNaiveBayesfitcnb

Argumentos de salida

expandir todo

, devuelto como un vector numérico.Los márgenes de clasificación

tiene la misma longitud igual a.msize(Mdl.X,1) Cada entrada de es el margen de clasificación de la observación correspondiente (fila) de y elemento de.mMdl.XMdl.Y

Ejemplos

expandir todo

Cargue el conjunto de datos de iris de Fisher.

load fisheriris X = meas;    % Predictors Y = species; % Response

Entrena a un ingenuo clasificador Bayes. Es recomendable especificar el orden de la clase. Supongamos que cada predictor es condicionalmente, normalmente distribuido dada su etiqueta.

Mdl = fitcnb(X,Y,'ClassNames',{'setosa','versicolor','virginica'});

es un clasificador.MdlClassificationNaiveBayes

Estime los márgenes de clasificación de la muestra. Visualice la distribución de los márgenes utilizando una gráfica de caja.

m = resubMargin(Mdl);  figure; boxplot(m); h = gca; iqr = quantile(m,0.75) - quantile(m,0.25); h.YLim = median(m) + iqr*[-4 4]; title 'Boxplot of the Margins';

Un margen de observación es la puntuación de clase observada (verdadera) menos la puntuación de clase falsa máxima entre todas las puntuaciones de la clase respectiva. Los clasificadores que producen márgenes relativamente grandes son deseables.

Los márgenes del clasificador miden, para cada observación, la diferencia entre la puntuación verdadera observada de la clase y la puntuación de clase falsa máxima para una clase en particular. Una forma de realizar la selección de características es comparar los márgenes en la muestra de varios modelos. Basado únicamente en este criterio, el modelo con los márgenes más altos es el mejor modelo.

Cargue el conjunto de datos de iris de Fisher. Defina dos conjuntos de datos:

  • contiene todos los predictores (excepto la columna eliminada de 0s).fullX

  • contiene los últimos 20 predictores.partX

load fisheriris X = meas;    % Predictors Y = species; % Response fullX = X; partX = X(:,3:4);

Entrena a los clasificadores Bayes ingenuos para cada conjunto de predictores.

FullMdl = fitcnb(fullX,Y); PartMdl = fitcnb(partX,Y);

Calcule los márgenes de la muestra para cada clasificador. Calcule los intervalos de confianza para cada muestra.

fullM = resubMargin(FullMdl); partM = resubMargin(PartMdl); n = size(X,1); fullMCI = mean(fullM) + 2*[-std(fullM)/n std(fullM)/n]
fullMCI = 1×2

    0.8898    0.8991

partMCI = mean(partM) + 2*[-std(partM)/n std(partM)/n]
partMCI = 1×2

    0.9129    0.9209

Los intervalos de confianza son ajustados y mutuamente excluyentes. El intervalo de confianza de margen del clasificador entrenado utilizando sólo predictores 3 y 4 tiene valores más altos que el del modelo completo. Por lo tanto, el modelo entrenado en dos predictores tiene un mejor rendimiento en la muestra.

Más acerca de

expandir todo