Main Content

Cuantificación y poda

Comprima una red neuronal profunda mediante el proceso de cuantificación o poda

Utilice Deep Learning Toolbox™ con el paquete de soporte Deep Learning Toolbox Model Quantization Library para reducir el uso de memoria y los requisitos computacionales de una red neuronal profunda de las siguientes formas:

  • Cuantificando los pesos, los sesgos y las activaciones de capas en tipos de datos de precisión enteros escalados. Después, podrá generar código C/C++, CUDA® o HDL a partir de esta red cuantificada.

    Para generación de código C/C++ y CUDA, el software genera código para una red neuronal profunda convolucional cuantificando los pesos, los sesgos y las activaciones de las capas convolucionales en tipos de datos enteros escalados de 8 bits. La cuantificación se lleva a cabo proporcionando el archivo de resultados de la calibración generado por la función calibrate al comando codegen (MATLAB Coder).

    La generación de código no es compatible con redes neuronales profundas cuantificadas producidas por la función quantize.

  • Podando filtros desde las capas de convolución mediante una aproximación de Taylor de primer orden. Después, podrá generar código C/C++, CUDA o HDL a partir de esta red podada.

Funciones

expandir todo

dlquantizerQuantize a deep neural network to 8-bit scaled integer data types
dlquantizationOptionsOptions for quantizing a trained deep neural network
calibrateSimulate and collect ranges of a deep neural network
quantizeQuantize deep neural network
validateQuantize and validate a deep neural network
quantizationDetailsDisplay quantization details for a neural network
estimateNetworkMetricsEstimate network metrics for specific layers of a neural network
equalizeLayersEqualize layer parameters of deep neural network
taylorPrunableNetworkNetwork that can be pruned by using first-order Taylor approximation
forwardCompute deep learning network output for training
predictCompute deep learning network output for inference
updatePrunablesRemove filters from prunable layers based on importance scores
updateScoreCompute and accumulate Taylor-based importance scores for pruning
dlnetworkDeep learning network for custom training loops

Apps

Deep Network QuantizerQuantize a deep neural network to 8-bit scaled integer data types

Temas

Cuantificación de deep learning

Cuantificación para un objetivo GPU

Cuantificación para un objetivo FPGA

Cuantificación para un objetivo CPU

Poda