Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

error

Clase: TreeBagger

Error (probabilidad de clasificación errónea o MSE)

Sintaxis

err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

Descripción

err = error(B,TBLnew,Ynew) calcula la probabilidad de clasificación errónea para los árboles de clasificación o el error cuadrado medio (MSE) para los árboles de regresión para cada árbol, para los predictores contenidos en la tabla dada la respuesta verdadera.TBLnewYnew Puede omitir si contiene la variable de respuesta.YnewTBLnew Si ha entrenado con datos de ejemplo contenidos en una tabla, los datos de entrada para este método también deben estar en una tabla.B

err = error(B,Xnew,Ynew) calcula la probabilidad de clasificación errónea para los árboles de clasificación o el error cuadrado medio (MSE) para los árboles de regresión para cada árbol, los predictores de para que se encuentran en la matriz dada la respuesta verdadera.XnewYnew Si ha entrenado con datos de ejemplo contenidos en una matriz, los datos de entrada para este método también deben estar en una matriz.B

Para la clasificación, puede ser un vector numérico, matriz de caracteres, matriz de cadena, matriz de celdas de vectores de caracteres, Vector categórico o Vector lógico.Ynew Para la regresión, debe ser un vector numérico. es un vector con una medida de error para cada uno de los árboles en el conjunto.YerrNTreesB

err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) O err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...) especifica pares de nombre-valor de parámetro opcionales:

'Mode'Vector de caracteres o escalar de cadena que indica cómo el método calcula los errores. Si se establece en (predeterminado), calcula los errores acumulativos y es un vector de longitud, donde el primer elemento da error de, segundo elemento da error de etc., hasta.'cumulative'errorerrNTreestrees(1)trees(1:2)trees(1:NTrees) Si se establece en, es un vector de longitud, donde cada elemento es un error de cada árbol en el conjunto.'individual'errNTrees Si se establece en, es un escalar que muestra el error acumulativo para todo el conjunto.'ensemble'err
'Weights'Vector de pesos de observación a utilizar para el promedio de errores. Por defecto, el peso de cada observación es 1. La longitud de este vector debe ser igual al número de filas en.X
'Trees'Vector de índices que indica qué árboles incluir en este cálculo. De forma predeterminada, este argumento se establece en y el método utiliza todos los árboles.'all' Si es un vector numérico, el método devuelve un vector de longitud para y modos, donde es el número de elementos en el vector de entrada y un escalar para el modo.'Trees'NTrees'cumulative''individual'NTrees'ensemble' Por ejemplo, en el modo, el primer elemento da error de, el segundo elemento da error de etc.'cumulative'trees(1)trees(1:2)
'TreeWeights'Vector de pesos de árboles. Este vector debe tener la misma longitud que el vector.'Trees' El método utiliza estos pesos para combinar la salida de los árboles especificados tomando un promedio ponderado en lugar del voto por mayoría no ponderado simple. No puede utilizar este argumento en el modo.'individual'
'UseInstanceForTree'Matriz lógica de tamaño-por-indicando qué árboles se deben utilizar para hacer predicciones para cada observación.NobsNTrees Por defecto, el método utiliza todos los árboles para todas las observaciones.

Algoritmos

Al estimar el error del conjunto:

  • Mediante el argumento de par nombre-valor, puede especificar que devuelva el error cualquiera de estas tres formas:'Mode'

    • El error de los árboles individuales en el conjunto

    • El error acumulado sobre todos los árboles

    • El error de todo el conjunto

  • Con el argumento de par nombre-valor, puede especificar qué árboles utilizar en los cálculos de error del conjunto.'Trees'

  • Mediante el argumento de par nombre-valor, puede especificar qué observaciones de los datos de entrada (y) se utilizarán en el cálculo de errores de conjunto para cada árbol seleccionado.'UseInstanceForTree'XY

  • Con el argumento de par nombre-valor, puede atribuir cada uno con un peso.'Weights'observation Para las fórmulas que siguen, Wj es el peso de la observación.j

  • Con el argumento de par nombre-valor, puede atribuir cada uno con un peso.'TreeWeights'tree

Para los problemas de regresión, estima el MSE ponderado del conjunto de árboles de regresión embolvado para predecir dado usando árboles y observaciones seleccionados.errorYX

  1. predice las respuestas de las observaciones seleccionadas en el uso de los árboles de regresión seleccionados en el conjunto.errorX

  2. La estimación MSE depende del valor de.'Mode'

    • Si usted especifica, después el MSE ponderado para el árbol es'Mode','Individual't

      MSEt=1j=1nwjj=1nwj(yjy^tj)2.

      y^tj es la respuesta pronosticada de observación del árbol de regresión seleccionado. establece las observaciones no seleccionadas dentro de un árbol seleccionado en el promedio de muestreo ponderado de las respuestas de datos de entrenamiento observadas.jterror

    • Si usted especifica, después el MSE ponderado es un vector del tamaño'Mode','Cumulative'T* que contiene MSEs acumulativos y ponderados sobre elT* ≤ árboles seleccionados. sigue estos pasos para estimar MSETerrort*, el MSE acumulado, ponderado usando los primeros árboles seleccionados.t

      1. Para observación seleccionada, = 1,...,, estimacionesjjnerror y^bag,tj, el promedio ponderado de las predicciones entre los primeros árboles seleccionados (para obtener más información, consultet predict). Para este cálculo, utiliza los pesos de árbol.error

      2. estima el acumulado, ponderado MSE a través del árbol.errort

        MSEt=1j=1nwjj=1nwj(yjy^bag,tj)2.

      establece las observaciones que no están seleccionadas para todos los árboles seleccionados en el promedio de muestreo ponderado de las respuestas de datos de entrenamiento observadas.error

    • Si usted especifica, después el MSE ponderado es el último elemento del vector acumulado, ponderado MSE.'Mode','Ensemble'

Para los problemas de clasificación, estima la tasa de clasificación errónea ponderada del conjunto de árboles de clasificación en bolsas para predecir dado utilizando árboles y observaciones seleccionados.errorYX

  • Si se especifica, la tasa de clasificación errónea ponderada para el árbol se'Mode','Individual't

    et=1j=1nwjj=1nwjI(yjy^tj).

    y^tj es la clase predicha para la observación seleccionada utilizando desde el árbol de clasificación seleccionado. establece las observaciones no seleccionadas dentro de un árbol seleccionado en la clase pronosticada, ponderada y más popular sobre todas las respuestas de entrenamiento.jterror Si hay varias clases más populares, considera que la que aparece en primer lugar en la propiedad del modelo es la más popular.errorClassNamesTreeBagger

  • Si especifica entonces la tasa de clasificación errónea ponderada es un vector de tamaño'Mode','Cumulative'T* que contengan tasas de clasificación errónea acumuladas y ponderadas en elT* ≤ árboles seleccionados. sigue estos pasos para estimarTerror et*, la tasa de clasificación errónea ponderada acumulada utilizando los primeros árboles seleccionados.t

    1. Para observación seleccionada, = 1,...,, estimacionesjjnerror y^bag,tj, la clase ponderada y más popular entre los primeros árboles seleccionados (para obtener más información, consultet predict). Para este cálculo, utiliza los pesos de árbol.error

    2. estima la tasa de clasificación errónea ponderada acumulada a través del árbol.errort

      et=1j=1nwjj=1nwjI(yjy^bag,tj).

      establece cualquier observación que no esté seleccionada para todos los árboles seleccionados en la clase pronosticada, ponderada y más popular sobre todas las respuestas de entrenamiento.error Si hay varias clases más populares, considera que la que aparece en primer lugar en la propiedad del modelo es la más popular.errorClassNamesTreeBagger

  • Si especifica, la tasa de clasificación errónea ponderada es el último elemento del vector de tasa de clasificación errónea ponderada acumulado.'Mode','Ensemble'