trainAutoencoder

Entrenar un codificador automático

Sintaxis

autoenc = trainAutoencoder(X)

autoenc = trainAutoencoder(X,hiddenSize)

autoenc = trainAutoencoder(___,Name,Value)

Descripción

autoenc = trainAutoencoder(X) devuelve un codificador automático, autoenc, entrenado usando los datos de entrenamiento de X.

ejemplo

autoenc = trainAutoencoder(X,hiddenSize) devuelve un codificador automático autoenc, con el tamaño de la representación oculta de hiddenSize.

autoenc = trainAutoencoder(___,Name,Value) devuelve un codificador automático autoenc, para cualquiera de los argumentos de entrada anteriores con opciones adicionales especificadas por uno o varios argumentos de par Name,Value.

Por ejemplo, puede especificar la proporción de escasez o el número máximo de iteraciones de entrenamiento.

ejemplo

Ejemplos

contraer todo

Entrenar un codificador automático disperso

Abrir script en vivo

Cargue los datos de muestra.

X = abalone_dataset;

X es una matriz de 8 por 4177 que define ocho atributos para 4177 conchas de abulón diferentes: sexo (M, F e I [para crías]), longitud, diámetro, altura, peso total, peso desconchado, peso de las vísceras y peso de la concha. Para obtener más información sobre el conjunto de datos, escriba help abalone_dataset en la línea de comandos.

Entrene un codificador automático disperso con la configuración predeterminada.

autoenc = trainAutoencoder(X);

Figure Neural Network Training (09-Aug-2025 13:40:24) contains an object of type uigridlayout.

Reconstruya los datos de anillos de conchas de abulón utilizando el codificador automático entrenado.

XReconstructed = predict(autoenc,X);

Calcule el error de reconstrucción cuadrático medio.

mseError = mse(X-XReconstructed)

mseError = 
0.0167

Entrenar un codificador automático con opciones especificadas

Abrir script en vivo

Cargue los datos de muestra.

X = abalone_dataset;

Entrene un codificador automático disperso con tamaño oculto 4, 400 épocas máximas y función de transferencia lineal para el decodificador.

autoenc = trainAutoencoder(X,4,'MaxEpochs',400,...
'DecoderTransferFunction','purelin');

Figure Neural Network Training (09-Aug-2025 13:39:43) contains an object of type uigridlayout.

Reconstruya los datos de anillos de conchas de abulón utilizando el codificador automático entrenado.

XReconstructed = predict(autoenc,X);

Calcule el error de reconstrucción cuadrático medio.

mseError = mse(X-XReconstructed)

mseError = 
0.0048

Reconstruir observaciones con un codificador automático disperso

Abrir script en vivo

Genere los datos de entrenamiento.

rng(0,'twister'); % For reproducibility
n = 1000;
r = linspace(-10,10,n)';
x = 1 + r*5e-2 + sin(r)./r + 0.2*randn(n,1);

Entrene el codificador automático con los datos de entrenamiento.

hiddenSize = 25;
autoenc = trainAutoencoder(x',hiddenSize,...
        'EncoderTransferFunction','satlin',...
        'DecoderTransferFunction','purelin',...
        'L2WeightRegularization',0.01,...
        'SparsityRegularization',4,...
        'SparsityProportion',0.10);

Figure Neural Network Training (09-Aug-2025 13:35:03) contains an object of type uigridlayout.

Genere los datos de prueba.

n = 1000;
r = sort(-10 + 20*rand(n,1));
xtest = 1 + r*5e-2 + sin(r)./r + 0.4*randn(n,1);

Prediga los datos de prueba con el codificador automático entrenado, autoenc.

xReconstructed = predict(autoenc,xtest');

Represente los datos de prueba reales y las predicciones.

figure;
plot(xtest,'r.');
hold on
plot(xReconstructed,'go');

Figure contains an axes object. The axes object contains 2 objects of type line. One or more of the lines displays its values using only markers

Reconstruir imágenes de dígitos manuscritos con el codificador automático disperso

Abrir script

Cargue los datos de entrenamiento.

XTrain = digitTrainCellArrayData;

Los datos de entrenamiento son un arreglo de 1 por 5000 celdas, donde cada celda contiene una matriz de 28 por 28 que representa una imagen sintética de un dígito manuscrito.

Entrene un codificador automático con una capa oculta que contenga 25 neuronas.

hiddenSize = 25;
autoenc = trainAutoencoder(XTrain,hiddenSize,...
        'L2WeightRegularization',0.004,...
        'SparsityRegularization',4,...
        'SparsityProportion',0.15);

Cargue los datos de prueba.

XTest = digitTestCellArrayData;

Los datos de prueba son un arreglo de 1 por 5000 celdas, donde cada celda contiene una matriz de 28 por 28 que representa una imagen sintética de un dígito manuscrito.

Reconstruya los datos de imagen de prueba con el codificador automático entrenado, autoenc.

xReconstructed = predict(autoenc,XTest);

Visualice los datos de prueba reales.

figure;
for i = 1:20
    subplot(4,5,i);
    imshow(XTest{i});
end

Visualice los datos de prueba reconstruidos.

figure;
for i = 1:20
    subplot(4,5,i);
    imshow(xReconstructed{i});
end

Argumentos de entrada

contraer todo

`X` — Datos de entrenamiento
matriz | arreglo de celdas de datos de imagen

Datos de entrenamiento, especificados como una matriz de muestras de entrenamiento o un arreglo de celdas de datos de imagen. Si X es una matriz, entonces cada columna contiene una sola muestra. Si X es un arreglo de celdas de datos de imagen, entonces los datos de cada celda deben tener el mismo número de dimensiones. Los datos de imagen pueden ser datos de intensidad de píxeles para imágenes en escala de grises, en cuyo caso cada celda contiene una matriz de m por n. De forma alternativa, los datos de imagen pueden ser datos RGB, en cuyo caso cada celda contiene una matriz de m por n por 3.

Tipos de datos: single | double | cell

`hiddenSize` — Tamaño de la representación oculta del codificador automático
10 (predeterminado) | valor entero positivo

Tamaño de la representación oculta del codificador automático, especificado como un valor entero positivo. Este número es el número de neuronas de la capa oculta.

Tipos de datos: single | double

Argumentos de par nombre-valor

contraer todo

Especifique pares de argumentos opcionales como Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos de nombre-valor deben aparecer después de otros argumentos. Sin embargo, el orden de los pares no importa.

En las versiones anteriores a la R2021a, utilice comas para separar cada nombre y valor, y encierre Name entre comillas.

Ejemplo: 'EncoderTransferFunction','satlin','L2WeightRegularization',0.05 especifica la función de transferencia para el codificador como la función de transferencia lineal saturante positiva y la regularización del peso L2 como 0,05.

`EncoderTransferFunction` — Función de transferencia del codificador
`'logsig'` (predeterminado) | `'satlin'`

Función de transferencia del codificador, especificada como el par separado por comas que consta de 'EncoderTransferFunction' y uno de los siguientes:

Opción de la función de transferencia Definición

Opción de la función de transferencia	Definición
`'logsig'`	Función sigmoide logística $f (z) = \frac{1}{1 + e^{- z}}$
`'satlin'`	Función de transferencia lineal saturada positiva $f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

'logsig'

Función sigmoide logística

$f (z) = \frac{1}{1 + e^{- z}}$

'satlin'

Función de transferencia lineal saturada positiva

$f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

Ejemplo: 'EncoderTransferFunction','satlin'

`DecoderTransferFunction` — Función de transferencia del decodificador
`'logsig'` (predeterminado) | `'satlin'` | `'purelin'`

Función de transferencia del decodificador, especificada como el par separado por comas que consta de 'DecoderTransferFunction' y uno de los siguientes:

Opción de la función de transferencia Definición

Opción de la función de transferencia	Definición
`'logsig'`	Función sigmoide logística $f (z) = \frac{1}{1 + e^{- z}}$
`'satlin'`	Función de transferencia lineal saturada positiva $f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$
`'purelin'`	Función de transferencia lineal $f (z) = z$

'logsig'

Función sigmoide logística

$f (z) = \frac{1}{1 + e^{- z}}$

'satlin'

Función de transferencia lineal saturada positiva

$f (z) = {\begin{matrix} 0, & if z \leq 0 \\ z, & if 0 < z < 1 \\ 1, & if z \geq 1 \end{matrix}$

'purelin'

Función de transferencia lineal

$f (z) = z$

Ejemplo: 'DecoderTransferFunction','purelin'

`MaxEpochs` — Número máximo de épocas de entrenamiento
1000 (predeterminado) | valor entero positivo

Número máximo de épocas de entrenamiento o iteraciones, especificado como el par separado por comas que consta de 'MaxEpochs' y un entero positivo.

Ejemplo: 'MaxEpochs',1200

`L2WeightRegularization` — El coeficiente para el regularizador de peso L₂
0.001 (predeterminado) | un valor escalar positivo

El coeficiente para el regularizador de peso L₂ en la función de coste (LossFunction), especificado como el par separado por comas que consta de 'L2WeightRegularization' y un valor escalar positivo.

Ejemplo: 'L2WeightRegularization',0.05

`LossFunction` — Función de pérdida que se desea usar para el entrenamiento
`'msesparse'` (predeterminado)

Función de pérdida que se desea usar para el entrenamiento, especificada como el par separado por comas que consta de 'LossFunction' y 'msesparse'. Corresponde a la función de error cuadrático medio ajustada para entrenar un codificador automático disperso de la siguiente manera:

$E = \underset{mean squared error}{\underset{︸}{\frac{1}{N} \sum_{n = 1}^{N} \sum_{k = 1}^{K} {(x_{k n} - {\hat{x}}_{k n})}^{2}}} + λ * \underset{\begin{matrix} L_{2} \\ regularization \end{matrix}}{\underset{︸}{Ω_{w e i g h t s}}} + β * \underset{\begin{matrix} sparsity \\ regularization \end{matrix}}{\underset{︸}{Ω_{s p a r s i t y}}},$

donde λ es el coeficiente del término de regularización L₂ y β es el coeficiente del término de regularización de escasez. Puede especificar los valores de λ y β utilizando los argumentos de par nombre-valor L2WeightRegularization y SparsityRegularization, respectivamente, mientras entrena un codificador automático.

`ShowProgressWindow` — Indicador para mostrar la ventana de entrenamiento
`true` (predeterminado) | `false`

Indicador para mostrar la ventana de entrenamiento, especificado como el par separado por comas que consta de 'ShowProgressWindow' y true o false.

Ejemplo: 'ShowProgressWindow',false

`SparsityProportion` — Proporción deseada de ejemplos de entrenamiento a los que reacciona una neurona
0.05 (predeterminado) | valor escalar positivo que oscila entre 0 y 1

Proporción deseada de ejemplos de entrenamiento a los que reacciona una neurona, especificada como el par separado por comas que consta de 'SparsityProportion' y un valor escalar positivo. La proporción de escasez es un parámetro del regularizador de escasez. Controla la escasez de la salida desde la capa oculta. Un valor bajo de SparsityProportion generalmente lleva a que cada neurona de la capa oculta se "especialice" al proporcionar solo una salida alta para una pequeña cantidad de ejemplos de entrenamiento. Por lo tanto, una proporción de escasez baja fomenta un mayor grado de escasez. Consulte Sparse Autoencoders.

Ejemplo: 'SparsityProportion',0.01 equivale a decir que cada neurona de la capa oculta debe tener una salida media de 0,1 en los ejemplos de entrenamiento.

`SparsityRegularization` — Coeficiente que controla el impacto del regularizador de escasez
1 (predeterminado) | un valor escalar positivo

Coeficiente que controla el impacto del regularizador de escasez en la función de coste, especificado como el par separado por comas que consta de 'SparsityRegularization' y un valor escalar positivo.

Ejemplo: 'SparsityRegularization',1.6

`TrainingAlgorithm` — El algoritmo que se desea utilizar para entrenar el codificador automático
`'trainscg'` (predeterminado)

El algoritmo que se desea utilizar para entrenar el codificador automático, especificado como el par separado por comas que consta de 'TrainingAlgorithm' y 'trainscg'. Significa gradiente descendente conjugado escalado [1].

`ScaleData` — Indicador para volver a escalar los datos de entrada
`true` (predeterminado) | `false`

Indicador para volver a escalar los datos de entrada, especificado como el par separado por comas que consta de 'ScaleData' y true o false.

Los codificadores automáticos intentan replicar la entrada en la salida. Para que sea posible, el rango de los datos de entrada debe coincidir con el rango de la función de transferencia del decodificador. trainAutoencoder escala automáticamente los datos de entrenamiento para que se ajusten a este rango al entrenar un codificador automático. Si los datos se escalaron durante el entrenamiento de un codificador automático, los métodos predict, encode y decode también escalan los datos.

Ejemplo: 'ScaleData',false

`UseGPU` — Indicador para usar la GPU para el entrenamiento
`false` (predeterminado) | `true`

Indicador para usar la GPU para el entrenamiento, especificado como el par separado por comas que consta de 'UseGPU' y true o false.

Ejemplo: 'UseGPU',true

Argumentos de salida

contraer todo

`autoenc` — Codificador automático entrenado
objeto `Autoencoder`

Codificador automático entrenado, devuelto como objeto Autoencoder. Para obtener información sobre las propiedades y los métodos de este objeto, consulte la página de clase Autoencoder.

Más acerca de

contraer todo

Codificadores automáticos

Un codificador automático es una red neuronal entrenada para replicar su entrada en su salida. El entrenamiento de un codificador automático no está supervisado en el sentido de que no se necesitan datos etiquetados. El proceso de entrenamiento todavía se basa en la optimización de una función de coste. La función de coste mide el error entre la entrada x y su reconstrucción en la salida $\hat{x}$ .

Un codificador automático está compuesto de un codificador y un decodificador. El codificador y decodificador pueden tener varias capas, pero por simplicidad considere que cada uno de ellos tiene una sola capa.

Si la entrada a un codificador automático es un vector $x \in ℝ^{D_{x}}$ , entonces el codificador asigna el vector x a otro vector $z \in ℝ^{D^{(1)}}$ de la siguiente manera:

$z = h^{^{(1)}} (W^{(1)} x + b^{(1)}),$

donde el superíndice (1) indica la primera capa. $h^{(1)} : ℝ^{D^{(1)}} \to ℝ^{D^{(1)}}$ es una función de transferencia del codificador, $W^{(1)} \in ℝ^{D^{(1)} \times D_{^{x}}}$ es una matriz de peso y $b^{(1)} \in ℝ^{D^{(1)}}$ es un vector de sesgo. A continuación, el decodificador asigna la representación codificada z nuevamente a una estimación del vector de entrada original, x, de la siguiente manera:

$\hat{x} = h^{^{(2)}} (W^{(2)} z + b^{(2)}),$

donde el superíndice (2) representa la segunda capa. $h^{(2)} : ℝ^{D_{x}} \to ℝ^{D_{x}}$ es la función de transferencia del decodificador, $W^{(1)} \in ℝ^{D_{^{x}} \times D^{(1)}}$ es una matriz de peso y $b^{(2)} \in ℝ^{D_{x}}$ es un vector de sesgo.

Codificadores automáticos dispersos

Es posible fomentar la escasez de un codificador automático añadiendo un regularizador a la función de coste [2]. Este regularizador es una función del valor medio de activación de salida de una neurona. La medida media de activación de salida de una neurona i se define como:

${\hat{ρ}}_{i} = \frac{1}{n} \sum_{j = 1}^{n} z_{i}^{(1)} (x_{j}) = \frac{1}{n} \sum_{j = 1}^{n} h (w_{i}^{(1) T} x_{j} + b_{i}^{(1)}),$

donde n es el número total de ejemplos de entrenamiento. x_j es el j-ésimo ejemplo de entrenamiento, $w_{i}^{(1) T}$ es la i-ésima fila de la matriz de peso $W^{(1)}$ y $b_{i}^{(1)}$ es la i-ésima entrada del vector de sesgo, $b^{(1)}$ . Se considera que una neurona está "disparándose" si su valor de activación de salida es alto. Un valor de activación de salida bajo significa que la neurona de la capa oculta se activa en respuesta a una pequeña cantidad de ejemplos de entrenamiento. Añadir un término a la función de coste que limite los valores de ${\hat{ρ}}_{i}$ para que sean bajos fomenta que el codificador automático aprenda una representación, donde cada neurona de la capa oculta se activa ante una pequeña cantidad de ejemplos de entrenamiento. Es decir, cada neurona se especializa respondiendo a alguna característica que solo está presente en un pequeño subconjunto de los ejemplos de entrenamiento.

Regularización de escasez

El regularizador de escasez intenta imponer una restricción a la escasez de la salida desde la capa oculta. Se puede fomentar la escasez añadiendo un término de regularización que tome un valor grande cuando el valor de activación medio, ${\hat{ρ}}_{i}$ , de una neurona i y su valor deseado, $ρ$ , no tienen un valor similar [2]. Uno de estos términos de regularización de escasez puede ser la divergencia de Kullback-Leibler.

$Ω_{s p a r s i t y} = \sum_{i = 1}^{D^{(1)}} K L (ρ ∥ {\hat{ρ}}_{i}) = \sum_{i = 1}^{D^{(1)}} ρ \log (\frac{ρ}{{\hat{ρ}}_{i}}) + (1 - ρ) \log (\frac{1 - ρ}{1 - {\hat{ρ}}_{i}})$

La divergencia de Kullback-Leibler es una función que mide cuán diferentes son dos distribuciones. En este caso, toma el valor cero cuando $ρ$ y ${\hat{ρ}}_{i}$ son iguales entre sí y aumenta a medida que divergen entre sí. Minimizar la función de coste obliga a que este término sea pequeño y, por lo tanto, a que $ρ$ y ${\hat{ρ}}_{i}$ estén cerca el uno del otro. Puede definir el valor deseado para el valor de activación medio utilizando el argumento de par nombre-valor SparsityProportion mientras entrena un codificador automático.

Regularización L₂

Al entrenar un codificador automático disperso, es posible hacer que el regularizador de dispersión sea pequeño aumentando los valores de los pesos w^(l) y disminuyendo los valores de z⁽¹⁾ [2]. Añadir un término de regularización en los pesos de la función de coste evita que esto suceda. Este término se denomina el término de regularización L₂ y se define como:

$Ω_{w e i g h t s} = \frac{1}{2} \sum_{l = 1}^{L} \sum_{j = 1}^{n_{l}} \sum_{i = 1}^{k_{l}} {(w_{j i}^{(l)})}^{2},$

donde L es el número de capas ocultas, n_l es el tamaño de salida de la capa l y k_l es el tamaño de entrada de la capa l. El término de regularización L₂ es la suma de los cuadrados de los elementos de las matrices de peso para cada capa.

Función de coste

La función de coste para entrenar un codificador automático disperso es una función de error cuadrático medio ajustada de la siguiente manera:

Referencias

[1] Moller, M. F. “A Scaled Conjugate Gradient Algorithm for Fast Supervised Learning”, Neural Networks, Vol. 6, 1993, pp. 525–533.

[2] Olshausen, B. A. and D. J. Field. “Sparse Coding with an Overcomplete Basis Set: A Strategy Employed by V1.” Vision Research, Vol.37, 1997, pp.3311–3325.

Historial de versiones

Introducido en R2015b

Consulte también

trainSoftmaxLayer | Autoencoder | encode | stack

Temas

Train Stacked Autoencoders for Image Classification

trainAutoencoder

Sintaxis

Descripción

Ejemplos

Entrenar un codificador automático disperso

Entrenar un codificador automático con opciones especificadas

Reconstruir observaciones con un codificador automático disperso

Reconstruir imágenes de dígitos manuscritos con el codificador automático disperso

Argumentos de entrada

X — Datos de entrenamiento matriz | arreglo de celdas de datos de imagen

hiddenSize — Tamaño de la representación oculta del codificador automático 10 (predeterminado) | valor entero positivo

Argumentos de par nombre-valor

EncoderTransferFunction — Función de transferencia del codificador 'logsig' (predeterminado) | 'satlin'

DecoderTransferFunction — Función de transferencia del decodificador 'logsig' (predeterminado) | 'satlin' | 'purelin'

MaxEpochs — Número máximo de épocas de entrenamiento 1000 (predeterminado) | valor entero positivo

L2WeightRegularization — El coeficiente para el regularizador de peso L2 0.001 (predeterminado) | un valor escalar positivo

LossFunction — Función de pérdida que se desea usar para el entrenamiento 'msesparse' (predeterminado)

ShowProgressWindow — Indicador para mostrar la ventana de entrenamiento true (predeterminado) | false

SparsityProportion — Proporción deseada de ejemplos de entrenamiento a los que reacciona una neurona 0.05 (predeterminado) | valor escalar positivo que oscila entre 0 y 1

SparsityRegularization — Coeficiente que controla el impacto del regularizador de escasez 1 (predeterminado) | un valor escalar positivo

TrainingAlgorithm — El algoritmo que se desea utilizar para entrenar el codificador automático 'trainscg' (predeterminado)

ScaleData — Indicador para volver a escalar los datos de entrada true (predeterminado) | false

UseGPU — Indicador para usar la GPU para el entrenamiento false (predeterminado) | true

Argumentos de salida

autoenc — Codificador automático entrenado objeto Autoencoder

Más acerca de

Codificadores automáticos

Codificadores automáticos dispersos

Regularización de escasez

Regularización L2

Función de coste

Referencias

Historial de versiones

Consulte también

Temas

`X` — Datos de entrenamiento
matriz | arreglo de celdas de datos de imagen

`hiddenSize` — Tamaño de la representación oculta del codificador automático
10 (predeterminado) | valor entero positivo

`EncoderTransferFunction` — Función de transferencia del codificador
`'logsig'` (predeterminado) | `'satlin'`

`DecoderTransferFunction` — Función de transferencia del decodificador
`'logsig'` (predeterminado) | `'satlin'` | `'purelin'`

`MaxEpochs` — Número máximo de épocas de entrenamiento
1000 (predeterminado) | valor entero positivo

`L2WeightRegularization` — El coeficiente para el regularizador de peso L₂
0.001 (predeterminado) | un valor escalar positivo

`LossFunction` — Función de pérdida que se desea usar para el entrenamiento
`'msesparse'` (predeterminado)

`ShowProgressWindow` — Indicador para mostrar la ventana de entrenamiento
`true` (predeterminado) | `false`

`SparsityProportion` — Proporción deseada de ejemplos de entrenamiento a los que reacciona una neurona
0.05 (predeterminado) | valor escalar positivo que oscila entre 0 y 1

`SparsityRegularization` — Coeficiente que controla el impacto del regularizador de escasez
1 (predeterminado) | un valor escalar positivo

`TrainingAlgorithm` — El algoritmo que se desea utilizar para entrenar el codificador automático
`'trainscg'` (predeterminado)

`ScaleData` — Indicador para volver a escalar los datos de entrada
`true` (predeterminado) | `false`

`UseGPU` — Indicador para usar la GPU para el entrenamiento
`false` (predeterminado) | `true`

`autoenc` — Codificador automático entrenado
objeto `Autoencoder`

Regularización L₂