Audio Toolbox

 

Audio Toolbox

Diseño y análisis de sistemas de procesamiento de voz, acústicos y de audio

 

Audio Toolbox™ proporciona herramientas para el procesamiento de audio, el análisis de la voz y la medición acústica. Incluye algoritmos para el procesamiento de señales de audio (como la ecualización y el control del rango dinámico) y la medición acústica (como la estimación de la respuesta a impulso, el filtrado de octavas y la ponderación perceptiva). También proporciona algoritmos para la extracción de características de audio y voz (como MFCC y tono) y la transformación de señales de audio (como el banco de filtros gammatono y el espectrograma con espaciado de Mel).

Las apps de esta toolbox soportan las pruebas de algoritmos en tiempo real, la medición de la respuesta a impulso y el etiquetado de señales de audio. La toolbox proporciona interfaces de streaming para tarjetas de audio y dispositivos MIDI de ASIO, WASAPI, ALSA y CoreAudio, así como herramientas para generar y alojar complementos de audio estándar como VST y Audio Units.

Con Audio Toolbox, podrá importar, etiquetar y aumentar conjuntos de datos de audio, además de extraer características y transformar señales para machine learning y deep learning. Es posible prototipar algoritmos de procesamiento de audio en tiempo real mediante el streaming de audio de baja latencia mientras se ajustan los parámetros y se visualizan las señales. También se puede validar el algoritmo mediante su conversión en un complemento de audio ejecutarlo en aplicaciones de alojamiento externas como, por ejemplo, estaciones de trabajo de audio digital. El alojamiento de complementos permite utilizar complementos de audio externos como objetos normales para procesar arrays de MATLAB®. La conectividad para tarjetas de sonido permite ejecutar mediciones personalizadas en señales de audio y sistemas acústicos reales.

Streaming de audio con tarjetas de sonido

Conecte con tarjetas de sonido estándar para portátiles y equipos de escritorio con el fin de realizar streaming de audio multicanal de baja latencia entre cualquier combinación de archivos y entradas/salidas en tiempo real.

Conectividad con controladores de audio estándar

Lea y escriba muestras de audio en tarjetas de sonido (como USB o Thunderbolt™) mediante controladores de audio estándar (como ASIO, WASAPI, CoreAudio y ALSA) en sistemas operativos Windows®, Mac® y Linux®.

Tarjetas de sonido multicanal.

Streaming de audio multicanal de baja latencia

Procese audio en tiempo real en MATLAB con una latencia de ida y vuelta de milisegundos.

Entrada sin procesar en tiempo real de un array de micrófonos de cuatro canales.

Machine learning y deep learning

Etiquete, aumente, cree y procese conjuntos de datos de audio y voz, extraiga características y calcule transformaciones de tiempo-frecuencia. Desarrolle analíticas de audio y voz con Statistics and Machine Learning Toolbox™, Deep Learning Toolbox™ u otras herramientas de machine learning.

Extracción de características de audio y voz

Extraiga características de bajo nivel para analíticas de voz y audio, incluidos los coeficientes cepstrales en las frecuencias de Mel (MFCC), los coeficientes cepstrales gammatono (GTCC), el tono, la armonicidad y los descriptores espectrales. Alimente arquitecturas de deep learning que trabajan con series temporales, como las basadas en capas LSTM.

Tono estimado (abajo) de una grabación de voz de varias palabras (arriba).

Transformaciones de tiempo-frecuencia

Transforme las señales en representaciones de tiempo-frecuencia mediante una transformada de coseno discreta modificada (MDCT), una transformada de Fourier de tiempo corto (STFT) o el espectrograma con espaciado de Mel, que es más compacto. Descomponga las señales mediante el uso de bandas de frecuencia con espaciado perceptivo que emplean bancos de filtros gammatono. Alimente modelos de Deep Learning que trabajan con datos bidimensionales, como los basados en capas de CNN.

Espectrograma de Mel en tiempo real de comandos de voz.

Etiquetado y creación de conjuntos de datos de audio

Cree nuevas grabaciones y asigne etiquetas de validación en terreno (ground-truth) a conjuntos de datos de audio y voz. Automatice la transcripción de voz mediante servicios de conversión de voz a texto basados en la nube.

Etiquetas de región de interés en la app Audio Labeler.

Procesamiento de grandes conjuntos de datos de audio

Indexe y lea grandes colecciones de grabaciones de audio mediante audioDatastore. Divida de forma aleatoria listas de archivos de audio de acuerdo con las etiquetas. Paralelice las tareas de procesamiento mediante tall arrays para aumentar los datos, realizar transformaciones de tiempo-frecuencia y extraer características.

Almacén de datos dirigido al conjunto de datos de comandos de voz de Google.

Algoritmos y efectos de procesamiento de audio

Genere formas de onda estándar, aplique efectos de audio habituales y diseñe sistemas de procesamiento de audio con visualización en tiempo real y ajuste dinámico de parámetros.

Filtros y ecualizadores de audio

Modele y aplique filtros EQ paramétricos, EQ gráficos, de shelving y de pendiente variable. Diseñe y simule filtros de cruce digital, de octavas y de fracciones de octavas.

Ajuste interactivo de un filtro de cruce de tres bandas con visualización en tiempo real.

Efectos y control de rango dinámico

Modelice y aplique algoritmos de procesamiento de rango dinámico para comprimir, limitar, expandir y usar una puerta de ruido. Agregue reverberación artificial con modelos paramétricos recursivos.

Ajuste interactivo de la respuesta dinámica de un compresor.

Simulación de sistemas con diagramas de bloques

Diseñe y simule modelos de sistemas mediante librerías de bloques de procesamiento de audio para Simulink®. Ajuste los parámetros y visualice el comportamiento del sistema mediante controles interactivos y diagramas dinámicos.

Detalle de un modelo de compresor de rango dinámico multibanda en Simulink.

Prototipado de audio en tiempo real

Valide los algoritmos de procesamiento de audio con pruebas interactivas de escucha en tiempo real en MATLAB.

Ajuste de parámetros en tiempo real mediante interfaces de usuario

Cree automáticamente interfaces de usuario para parámetros de algoritmos de procesamiento de audio que se pueden ajustar. Pruebe cada algoritmo con la app Audio Test Bench y ajuste los parámetros en los programas en ejecución con controles interactivos generados automáticamente.

Ajuste interactivo de un EQ paramétrico de tres bandas personalizado mediante Audio Test Bench.

Conectividad con MIDI para el control de parámetros y el intercambio de mensajes

Cambie de forma interactiva los parámetros de los algoritmos de MATLAB mediante superficies de control MIDI. Controle el hardware externo o responda a los eventos mediante el envío y la recepción de cualquier tipo de mensaje MIDI.

Mensaje MIDI y flujo de señales de audio escritos en MATLAB para un sintetizador de instrumento musical.

Mediciones acústicas y audio espacial

Mida las respuestas del sistema, analice y mida las señales y diseñe sistemas de procesamiento de audio espacial.

Medición y análisis basados en estándares

Aplique medidores de nivel de presión sonora (SPL) y medidores de volumen a señales grabadas o en tiempo real. Analice las señales con filtros de octavas y de fracciones de octavas. Aplique filtros de ponderación A, C o K conformes a estándares a grabaciones sin procesar.

Visualización de distintas medidas de SPL en bandas de tercio de octava.

Medición de la respuesta a impulso

Mida las respuestas a impulso y frecuencia de sistema acústicos y de audio mediante secuencias de longitud máxima (MLS) y sinusoides de barrido exponencial (ESS). Comience a utilizar la app Impulse Response Measurer. Automatice las mediciones mediante la generación programática de señales de excitación y la estimación de las respuestas del sistema.

 App Impulse Response Measurer.

Convolución eficiente con respuestas a impulsos de sala

Convolucione las señales con respuestas a impulsos largas de forma eficiente mediante implementaciones overlap-and-add u overlap-and-save en el dominio de frecuencia. Encuentre el equilibro entre latencia y velocidad de cálculo mediante partición automática de la respuesta a impulso.

Respuesta a impulso de 5 segundos o más con muestras de 220 k a 44 100 Hz.

Audio espacial

Codifique y decodifique distintos formatos ambisónicos. Interpole funciones de transferencia relacionadas con la cabeza (HRTF) con muestreo espacial.

Ejemplo de posición de la fuente de sonido deseada y ángulos más cercanos con mediciones HRTF disponibles.

Generación y alojamiento de complementos de audio

Prototipe algoritmos de procesamiento de audio escritos en MATLAB como complementos de audio estándar; utilice complementos de audio externos como objetos normales de MATLAB.

Generación de complementos de audio

Genere complementos VST y de otros tipos directamente a partir de código MATLAB sin necesidad de diseñar manualmente interfaces de usuario. Con MATLAB Coder™, genere proyectos JUCE C++ listos para crear destinados al prototipado de complementos más avanzados.

Ejemplo de EQ paramétrico multibanda: complemento VST generado a partir de código MATLAB que se ejecuta en REAPER.

Alojamiento de complementos de audio externos

Utilice complementos VST y AU externos como objetos normales de MATLAB. Cambie los parámetros de los complementos y procese arrays de MATLAB de forma programática. Si lo prefiere, automatice las asociaciones de parámetros de complementos con interfaces de usuario y controles MIDI. Aloje complementos generados a partir de código MATLAB para aumentar la eficiencia de ejecución.

Ejemplo de complemento VST externo para la eliminación de ruido en audio (Accusonus ERA-N) e interfaz programática en MATLAB.

Sistemas de audio en tiempo real y embebidos en plataformas

Utilice productos de generación de código C para complementos a fin de implementar diseños de procesamiento de audio en dispositivos de software y automatizar la conectividad con interfaces de audio multicanal.

Dispositivos móviles y de bajo coste

Prototipe diseños de procesamiento de audio en Raspberry Pi™ mediante interfaces de audio multicanal integrados o externos. Cree paneles de control interactivos como apps móviles para dispositivos Android® o iOS.

Una placa Raspberry Pi 3. 

Sistemas sin latencia

Prototipe diseños de procesamiento de audio con entradas y salidas de muestra única para el control de ruido adaptativo, la validación de audífonos u otras aplicaciones que requieren una latencia DSP de ida y vuelta mínima. Ejecute automáticamente los modelos de Simulink en máquinas de audio Speedgoat y placas ST de Discovery.

Funcionalidades más recientes

Extracción de características

Calcule los coeficientes cepstrales gammatono (GTCC), la armonicidad y once descriptores espectrales para aplicaciones de machine learning y deep learning.

Espectrograma con espaciado de Mel

Transforme las señales en representaciones de tiempo-frecuencia compactas con espaciado perceptivo.

Bancos de filtros gammatono y de octavas

Descomponga las señales de audio en bandas de frecuencia espaciadas de forma perceptiva o logarítmica.

Generación de proyectos con complementos JUCE

Genere un proyecto JUCE C++ a partir de su complemento de audio de MATLAB (requiere MATLAB Coder).

Ajustador de parámetros de complementos

Ajuste gráficamente los parámetros de los algoritmos de MATLAB mientras los ejecuta de forma programática.

Consulte las notas de la versión para obtener detalles sobre estas características y las funciones correspondientes.

Consiga una prueba gratuita

30 días de exploración a su alcance.

Descargar ahora

¿Listo para comprar?

Solicitar precio y explore los productos relacionados.

¿Eres estudiante?

Obtenga el software para estudiantes de MATLAB y Simulink.

Más información