Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

RegressionPartitionedEnsemble

Paquete: classreg.learning.partition
Superclases: RegressionPartitionedModel

Conjunto de regresión validado con validación cruzada

Descripción

es un conjunto de conjuntos de regresión entrenados en pliegues con validación cruzada.RegressionPartitionedEnsemble Estimar la calidad de la clasificación mediante validación cruzada utilizando uno o más métodos "kfold": kfoldfun, kfoldLossO kfoldPredict. Cada método "kfold" utiliza modelos formados en observaciones en pliegue para predecir la respuesta de las observaciones fuera de pliegue. Por ejemplo, supongamos que se cruza la validación mediante cinco pliegues. En este caso, cada pliegue de formación contiene aproximadamente 4/5 de los datos y cada pliegue de prueba contiene aproximadamente 1/5 de los datos. El primer modelo almacenado en fue entrenado en y con los primeros 1/5 excluidos, el segundo modelo almacenado en fue entrenado en y con el segundo 1/5 excluidos, y así sucesivamente.Trained{1}XYTrained{2}XY Cuando llames a kfoldPredict, calcula las predicciones para el primer 1/5 de los datos utilizando el primer modelo, para el segundo 1/5 de datos utilizando el segundo modelo y así sucesivamente. En Resumen, la respuesta para cada observación se calcula mediante kfoldPredict usando el modelo entrenado sin esta observación.

Construcción

cvens = crossval(ens) crea un conjunto con validación cruzada a partir de un conjunto de regresión.ens Para obtener detalles de sintaxis, consulte el crossval Página de referencia de método.

cvens = fitrensemble(X,Y,Name,Value) crea un conjunto validado de forma cruzada cuando es uno de,,, o.Name'crossval''kfold''holdout''leaveout''cvpartition' Para obtener detalles de sintaxis, consulte la página de referencia de función.fitrensemble

Argumentos de entrada

ens

Un conjunto de regresión construido con.fitrensemble

Propiedades

BinEdges

Aristas de ubicación para los predictores numéricos, especificados como una matriz de celdas de vectores numéricos, donde es el número de predictores.pp Cada vector incluye los bordes de la papelera para un predictor numérico. El elemento en la matriz de celdas para un predictor categórico está vacío porque el software no bin predictores categóricos.

Los predictores numéricos de bins de software solo si especifica el argumento de par nombre-valor como un escalar entero positivo al entrenar un modelo con alumnos de árbol.'NumBins' La propiedad está vacía si el valor está vacío (valor predeterminado).BinEdges'NumBins'

Puede reproducir los datos de predictor en binned utilizando la propiedad del modelo entrenado.XbinnedBinEdgesmdl

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
contiene los índices de ubicación, que van desde 1 hasta el número de bins, para los predictores numéricos. valores son 0 para los predictores categóricos.XbinnedXbinned Si contiene s, los valores correspondientes son s.XNaNXbinnedNaN

CategoricalPredictors

Índices predictores categóricos, especificados como un vector de enteros positivos. contiene valores de índice correspondientes a las columnas de los datos del predictor que contienen predictores categóricos.CategoricalPredictors Si ninguno de los predictores es categórico, entonces esta propiedad está vacía ().[]

CrossValidatedModel

Nombre del modelo validado de forma cruzada, un vector de caracteres.

Kfold

Número de pliegues utilizados en un árbol con validación cruzada, un entero positivo.

ModelParameters

Objetos que sostienen parámetros de.tree

NumObservations

Escalar numérico que contiene el número de observaciones de los datos de entrenamiento.

NTrainedPerFold

Vector de elementos.Kfold Cada entrada contiene el número de alumnos capacitados en este pliegue de validación cruzada.

Partition

La partición de clase utilizada en la creación del conjunto de validación cruzada.cvpartition

PredictorNames

Matriz de nombres de celdas para las variables predictoras, en el orden en que aparecen.X

ResponseName

Nombre de la variable de respuesta, un vector de caracteres.Y

ResponseTransform

Identificador de función para transformar puntuaciones o vector de caracteres que representa una función de transformación integrada. significa que no hay transformación; equivalentemente, significa.'none''none'@(x)x

Añadir o cambiar una función utilizando la notación de puntos:ResponseTransform

ens.ResponseTransform = @function

Trainable

Matriz celular de conjuntos formados en pliegues de validación cruzada. Cada conjunto está lleno, lo que significa que contiene sus datos de entrenamiento y pesos.

Trained

Matriz celular de conjuntos compactos formados en pliegues de validación cruzada.

W

La escala, un vector con la longitud, el número de filas en.weightsnX

X

Una matriz o tabla de valores predictores. Cada columna de representa una variable, y cada fila representa una observación.X

Y

Un vector de columna numérico con el mismo número de filas que.X Cada entrada es la respuesta a los datos en la fila correspondiente de.YX

Métodos

kfoldLossLa pérdida de validación cruzada del conjunto de regresión particionada
resumeReanudar conjunto de entrenamiento

Métodos heredados

kfoldLossLa pérdida de validación cruzada del modelo de regresión con particiones
kfoldPredictPredecir la respuesta para observaciones no utilizadas para el entrenamiento
kfoldfunFunción de validación cruzada

Semántica de copia

Valor. Para saber cómo afectan las clases de valor a las operaciones de copia, consulte.Copiar objetos (MATLAB)

Ejemplos

contraer todo

Construya un conjunto de regresión con particiones y examine las pérdidas de validación cruzada para los pliegues.

Cargue el conjunto de datos.carsmall

load carsmall;

Cree un subconjunto de variables.

XX = [Cylinders Displacement Horsepower Weight]; YY = MPG;

Construya el modelo de conjunto.

rens = fitrensemble(XX,YY);

Crear un conjunto validado entre.rens

rng(10,'twister') % For reproducibility cvrens = crossval(rens);

Examine las pérdidas de validación cruzada.

L = kfoldLoss(cvrens,'mode','individual')
L = 10×1

   21.4489
   48.4388
   28.2223
   17.5354
   29.9441
   49.5254
   43.8872
   31.0152
   31.6388
    8.9607

L es un vector que contiene la pérdida de validación cruzada para cada aprendiz entrenado en el conjunto.