Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

CompactTreeBagger clase

Conjunto compacto de árboles de decisión cultivados por agregación de bootstrap

Descripción

clase es una clase ligera que contiene los árboles cultivados con. no preserva ninguna información sobre cómo crecieron los árboles de decisión.CompactTreeBaggerTreeBaggerCompactTreeBaggerTreeBagger No contiene los datos de entrada utilizados para cultivar árboles, ni contiene parámetros de entrenamiento como el tamaño mínimo de la hoja o el número de variables muestreadas para cada división de decisión al azar. Sólo se puede utilizar para predecir la respuesta del conjunto entrenado dados nuevos datos, y otras funciones relacionadas.CompactTreeBaggerX

le permite guardar el conjunto entrenado en el disco, o utilizarlo de cualquier otra manera, mientras descarta los datos de entrenamiento y varios parámetros de la configuración de entrenamiento irrelevantes para predecir la respuesta del conjunto completamente crecido.CompactTreeBagger Esto reduce los requisitos de almacenamiento y memoria, especialmente para conjuntos formados en grandes conjuntos de datos.

Construcción

CompactTreeBaggerCrear objeto CompactTreeBagger

CMdl = compact(Mdl) crea una versión compacta de un objeto de modelo.MdlTreeBagger Puede predecir regresiones utilizando exactamente como se puede utilizar.CMdlMdl Sin embargo, dado que no contiene datos de entrenamiento, no puede realizar algunas acciones, como hacer predicciones fuera de bolsa medianteCMdl oobPredict.

Métodos

combineCombine dos conjuntos
errorError (probabilidad de clasificación errónea o MSE)
marginMargen de clasificación
mdsproxLa escala multidimensional de la matriz de proximidad
meanMarginEl margen de clasificación medio
outlierMeasureMedida de valor atípico para datos
predictPredecir las respuestas usando un conjunto de árboles de decisión en bolsas
proximityMatriz de proximidad de datos
setDefaultYfitEstablezca el valor predeterminado paraPredecir

Propiedades

ClassNames

La propiedad es una matriz de celdas que contiene los nombres de clase para la variable de respuesta suministrada.ClassNamesYTreeBagger Esta propiedad está vacía para los árboles de regresión.

DefaultYfit

La propiedad controla el valor de predicción que se devuelve cuando no es posible realizar predicciones, por ejemplo, cuando el método necesita predecir una observación que solo tiene valores falsos en la matriz suministrada a través del argumento.DefaultYfitCompactTreeBaggerPredecir'useifort'

Para la clasificación, puede establecer esta propiedad en cualquiera o.'''MostPopular' Si elige (valor predeterminado), el valor de propiedad se convierte en el nombre de la clase más probable en los datos de entrenamiento.'MostPopular'

Para la regresión, puede establecer esta propiedad en cualquier escalar numérico. El valor predeterminado es la media de la respuesta para los datos de entrenamiento.

DeltaCriterionDecisionSplit

La propiedad es una matriz numérica de tamaño 1-por-de los cambios en el criterio de división sumado a las divisiones en cada variable, promediada a través de todo el conjunto de árboles cultivados.DeltaCriterionDecisionSplitNvars

Method

La propiedad es para conjuntos de clasificación y para conjuntos de regresión.Method'classification''regression'

NumPredictorSplit

La propiedad es una matriz numérica de tamaño 1 por-, donde cada elemento da un número de divisiones en este predictor sumó a todos los árboles.NumPredictorSplitNvars

NumTrees

La propiedad es un escalar igual al número de árboles de decisión en el conjunto.NumTrees

PredictorNames

La propiedad es una matriz de celdas que contiene los nombres de las variables predictoras (entidades).PredictorNames Estos nombres se toman del parámetro opcional que se suministra a.'names'TreeBagger Los nombres predeterminados son,, etc.'x1''x2'

SurrogateAssociation

La propiedad es una matriz de tamaño-por-con medidas predictivas de asociación variable, promediada en todo el conjunto de árboles cultivados.SurrogateAssociationNvarsNvars Si ha crecido la configuración del conjunto a, esta matriz para cada árbol se rellena con medidas predictivas de asociación promediada sobre las divisiones sustitutas.'surrogate''on' Si ha crecido el ajuste de conjunto a (por defecto), es diagonal.'surrogate''off'SurrogateAssociation

Trees

La propiedad es una matriz de celdas de tamaño por 1 que contiene los árboles en el conjunto.TreesNumTrees

Ejemplos

contraer todo

Cree una bolsa compacta de árboles para hacer predicciones de manera eficiente sobre nuevos datos.

Cargue el conjunto de datos.ionosphere

load ionosphere

Entrenar una bolsa de 100 árboles de clasificación utilizando todas las mediciones y el método.AdaBoostM1

Mdl = TreeBagger(100,X,Y,'Method','classification')
Mdl =    TreeBagger Ensemble with 100 bagged decision trees:                     Training X:             [351x34]                     Training Y:              [351x1]                         Method:       classification                  NumPredictors:                   34          NumPredictorsToSample:                    6                    MinLeafSize:                    1                  InBagFraction:                    1          SampleWithReplacement:                    1           ComputeOOBPrediction:                    0  ComputeOOBPredictorImportance:                    0                      Proximity:                   []                     ClassNames:             'b'             'g'    Properties, Methods  

es un objeto de modelo que contiene los datos de entrenamiento, entre otras cosas.MdlTreeBagger

Cree una versión compacta de.Mdl

CMdl = compact(Mdl)
CMdl =    CompactTreeBagger Ensemble with 100 bagged decision trees:               Method:       classification        NumPredictors:                   34           ClassNames: 'b' 'g'    Properties, Methods  

es un objeto de modelo. es casi lo mismo que.CMdlCompactTreeBaggerCMdlMdl Una excepción es que no almacena los datos de entrenamiento.

Compare las cantidades de espacio consumido por y.MdlCMdl

mdlInfo = whos('Mdl'); cMdlInfo = whos('CMdl'); [mdlInfo.bytes cMdlInfo.bytes]
ans = 1×2

     1066952      925404

consume más espacio que.MdlCMdl

almacena los árboles de clasificación entrenados (objetos de modelo) que componen.CMdl.TreesCompactClassificationTreeMdl

Muestre un gráfico del primer árbol en el modelo compacto.

view(CMdl.Trees{1},'Mode','graph');

Por defecto, crece árboles profundos.TreeBagger

Predecir la etiqueta de la media de usar el conjunto compacto.X

predMeanX = predict(CMdl,mean(X))
predMeanX = 1x1 cell array
    {'g'}

Semántica de copia

Valor. Para obtener información sobre cómo esto afecta al uso de la clase, consulte la documentación de programación orientada a objetos.Comparando las clases de identificador y valor (MATLAB)MATLAB®

Sugerencias

La propiedad de almacena un vector de celda o objetos de modelo.TreesCMdlCMdl.NumTreesCompactClassificationTreeCompactRegressionTree Para una visualización textual o gráfica del árbol t en el vector de celda, escriba

view(CMdl.Trees{t})