Computer Vision Toolbox

Diseñe y pruebe sistemas de procesamiento de vídeo, visión artificial y visión 3D

Computer Vision Toolbox™ proporciona algoritmos, funciones y apps para diseñar y probar sistemas de procesamiento de vídeo, visión artificial y visión 3D. Puede realizar detección y seguimiento de objetos, así como detección, extracción y coincidencia de características. En el caso de la visión 3D, la toolbox soporta la calibración de cámaras simples, estéreo y ojo de pez, la visión en estéreo, la reconstrucción 3D y el procesamiento de nubes de puntos de LiDAR y 3D. Las apps de visión artificial automatizan los flujos de trabajo de etiquetado de validación (ground-truth) y de calibración de cámaras.

Puede entrenar detectores de objetos personalizados mediante algoritmos de deep learning y machine learning tales como YOLO v2, Faster R-CNN y ACF. Para la segmentación semántica, se pueden usar algoritmos de deep learning tales como SegNet, U-Net y DeepLab. Los modelos previamente entrenados permiten detectar caras, peatones y otros objetos comunes.

Puede acelerar los algoritmos mediante su ejecución en procesadores multinúcleo y GPU. La mayoría de los algoritmos de esta toolbox soportan la generación de código C/C++ para su integración con el código existente, el prototipado en escritorio y el despliegue de sistemas de visión embebidos.

Más información:

Deep learning y machine learning

Detecte, reconozca y segmente objetos mediante deep learning y machine learning.

Detección y reconocimiento de objetos

Marcos para entrenar, evaluar y desplegar detectores de objetos tales como YOLO v2, Faster R-CNN, ACF y Viola-Jones. Las prestaciones de reconocimiento de objetos incluyen OCR y bolsa de palabras visuales. Los modelos previamente entrenados detectan caras, peatones y otros objetos comunes.

Detección de objetos mediante Faster R-CNN. 

Segmentación semántica

Segmente imágenes y volúmenes 3D mediante la clasificación de píxeles y vóxeles individuales con redes tales como SegNet, FCN, U-Net y DeepLab v3+.

Etiquetado de validación (ground-truth)

Automatice el etiquetado para detección de objetos, segmentación semántica y clasificación de escenas mediante las apps Video Labeler e Image Labeler.

Etiquetado de validación (ground-truth) con la app Video Labeler.

Procesamiento de nubes de puntos 3D y de LiDAR

Realice segmentación, agrupación en cluster, reducción de la tasa de muestreo, eliminación de ruido, registro y ajuste de formas geométricas con datos de nubes de puntos 3D o de LiDAR. Lidar Toolbox™ ofrece funcionalidades adicionales para diseñar, analizar y probar sistemas de procesamiento de LiDAR.

E/S de nubes de puntos de LiDAR

Lea, escriba y visualice nubes de puntos a partir de archivos, LiDAR y sensores RGB-D.

Registro de nubes de puntos

Registre nubes de puntos 3D mediante los algoritmos NDT (transformada de distribuciones normales), ICP (punto más cercano iterativo) y CPD (movimiento de puntos coherente).

Registro y unión de una serie de nubes de puntos.

Segmentación y ajuste de formas

Segmente nubes de puntos en clusters y ajuste las formas geométricas a nubes de puntos. Segmente el plano de tierra de los datos de LiDAR para aplicaciones de conducción autónoma y robótica.

Segmentación de una nube de puntos de LiDAR.

Calibración de cámaras

Estime los parámetros intrínsecos, extrínsecos y de distorsión de lente de las cámaras.

Calibración de una sola cámara

Automatice la detección del tablero de ajedrez y calibre las cámaras estenopeicas y ojo de pez mediante la app Camera Calibrator.

Calibración de cámaras estéreo

Calibre un par de cámaras estéreo para calcular la profundidad y reconstruir escenas 3D.

App Stereo Camera Calibrator.

Visión 3D y visión en estéreo

Extraiga la estructura 3D de una escena a partir de varias vistas 2D. Estime el movimiento y la posición de la cámara mediante odometría visual.

Mapa de disparidad estéreo que representa las profundidades relativas.

Detección, extracción y coincidencia de características

Flujos de trabajo basados en características para detección de objetos, registro de imágenes y reconocimiento de objetos.

Detección de un objeto en una imagen repleta de objetos a través de la detección, extracción y coincidencia de características de puntos.

Registro de imágenes basado en características

Encuentre coincidencias entre características de varias imágenes para estimar la transformación geométrica entre imágenes y registrar la secuencia de imágenes.

Imagen panorámica creada mediante el registro basado en características.

Seguimiento de objetos y estimación del movimiento

Estime el movimiento y realice el seguimiento de objetos en secuencias de vídeo e imágenes.

Estimación del movimiento

Estime el movimiento entre distintos cuadros de vídeo mediante flujo óptico, coincidencia de bloques y coincidencia de plantillas.

Detección de objetos en movimiento con una cámara fija.

Interfaz OpenCV

Establezca una interfaz para MATLAB y Simulink con proyectos y funciones basados en OpenCV.

Generación de código

Integre el desarrollo de algoritmos con flujos de trabajo de prototipado rápido, implementación y verificación.