Esta página se ha traducido mediante traducción automática. Haga clic aquí para ver la última versión en inglés.

stereovslam

Localización y mapeo visual simultáneo basado en características (vSLAM) y fusión de sensores visuales-inerciales con cámara estéreo

Desde R2025a

expandir todo en la página

Descripción

Utilice el objeto stereovslam para realizar localización y mapeo visual simultáneo (vSLAM) con datos de cámara estéreo. Para obtener más información sobre SLAM visual, consulte Implement Visual SLAM in MATLAB (Computer Vision Toolbox).

El objeto stereovslam extrae características Oriented FAST y Rotated BRIEF (ORB) de imágenes leídas incrementalmente y luego rastrea esas características para estimar poses de cámara, identificar fotogramas clave y reconstruir un entorno 3D. El algoritmo vSLAM también busca cierres de bucle utilizando el algoritmo de bolsa de características y luego optimiza las poses de la cámara utilizando la optimización del gráfico de poses. Puede mejorar la precisión y la robustez del SLAM integrando este objeto con datos IMU para realizar una fusión de sensores visuales-inerciales.

Creación

Sintaxis

vslam = stereovslam(intrinsics,baseline)

vslam = stereovslam(reprojectionMatrix,imageSize)

vslam = stereovslam(___,imuParameters)

vslam = stereovslam(___,PropertyName=Value)

Descripción

vslam = stereovslam(intrinsics,baseline) crea un objeto SLAM visual estéreo, vslam, utilizando los parámetros intrínsecos de la cámara estéreo rectificada intrinsics y la distancia baseline entre las cámaras izquierda y derecha rectificadas.

El objeto representa puntos de mapas 3D y poses de cámara en coordenadas mundiales, y asume que la pose de la cámara del primer fotograma clave es una transformación de identidad rigidtform3d (Image Processing Toolbox).

Nota

El objeto stereovslam se ejecuta en varios subprocesos internamente, lo que puede retrasar el procesamiento de un cuadro de imagen agregado mediante la función addFrame. Además, el objeto que se ejecuta en varios subprocesos significa que el cuadro actual que el objeto está procesando puede ser diferente del cuadro agregado recientemente.

ejemplo

vslam = stereovslam(reprojectionMatrix,imageSize) crea un objeto SLAM visual estéreo vslam utilizando la matriz de reproyección de cámara estéreo, reprojectionMatrix, y el tamaño de la imagen, imageSize.

vslam = stereovslam(___,imuParameters) realiza un SLAM visual-inercial estéreo basado en el imuParameters especificado. Al utilizar este argumento con datos IMU, se requiere Navigation Toolbox™

vslam = stereovslam(___,PropertyName=Value) establece propiedades utilizando uno o más argumentos de nombre-valor además de cualquier combinación de argumentos de entrada de sintaxis anteriores. Por ejemplo, MaxNumPoints=850 establece el número máximo de puntos de características ORB para extraer de cada imagen en 850.

Argumentos de entrada

expandir todo

`intrinsics` — Parámetros intrínsecos de la cámara estéreo rectificada
objeto `cameraIntrinsics`

Parámetros intrínsecos de la cámara estéreo rectificados, especificados como un objeto cameraIntrinsics (Computer Vision Toolbox).

Este argumento establece la propiedad Intrinsics.

`baseline` — Distancia entre las cámaras izquierda y derecha rectificadas
escalar no negativo

Distancia entre las cámaras izquierda y derecha rectificadas, especificada como un escalar no negativo. Los algoritmos vSLAM estéreo generalmente rastrean la cámara principal (o izquierda), en cuyo caso la línea de base es mayor que cero. Un valor de base negativo indica un rango de disparidad negativo y el algoritmo vSLAM rastrea la cámara secundaria (o derecha).

Este argumento establece la propiedad Baseline.

`reprojectionMatrix` — Matriz de reproyección
matriz de 4 por 4

Matriz de reproyección, especificada como una matriz de 4 por 4 con la forma:

donde f y (cx, cy) son la distancia focal y el punto principal de la cámara primaria rectificada, respectivamente. b es la línea base de la cámara estéreo rectificada virtual.

Puede obtener la matriz de reproyección utilizando la función rectifyStereoImages (Computer Vision Toolbox).

`imageSize` — Tamaño de la imagen producida por la cámara
vector de dos elementos

Tamaño de la imagen producida por la cámara, en píxeles, especificado como un vector de dos elementos con la forma [nrows ncols]. Los elementos nrows y ncols representan el número de filas y columnas, respectivamente.

`imuParameters` — Parámetros de la IMU
objeto `factorIMUParameters`

Parámetros IMU, especificados como un objeto factorIMUParameters. El objeto contiene información de ruido, sesgo y frecuencia de muestreo sobre la unidad de medición inercial (IMU).

Propiedades

expandir todo

Parámetros de la cámara

`Intrinsics` — Parámetros intrínsecos de la cámara
Solo lectura: objeto `cameraIntrinsics`

Esta propiedad o parámetro es de solo lectura.

Parámetros intrínsecos de la cámara, almacenados como un objeto cameraIntrinsics (Computer Vision Toolbox).

Utilice el argumento intrinsics para establecer esta propiedad.

`Baseline` — Distancia entre las cámaras izquierda y derecha rectificadas
escalar no negativo

Distancia entre las cámaras izquierda y derecha rectificadas, almacenada como un escalar no negativo. Los algoritmos vSLAM estéreo generalmente rastrean la cámara principal (o izquierda), en cuyo caso la línea de base es mayor que cero. Un valor de base negativo indica un rango de disparidad negativo y el algoritmo vSLAM rastrea la cámara secundaria (o derecha).

Utilice el argumento baseline para establecer esta propiedad.

`DisparityRange` — Rango de disparidad
Solo lectura: `[0 48]` (predeterminado) | vector de dos elementos de números enteros

Esta propiedad o parámetro es de solo lectura.

Rango de disparidad, especificado como un vector de dos elementos de números enteros con la forma [min max]. Los elementos especifican la disparidad mínima y máxima, respectivamente. El rango debe estar dentro del ancho de la imagen y la diferencia entre el mínimo y el máximo debe ser divisible por 16.

`UniquenessThreshold` — Valor mínimo de unicidad
`15` (predeterminado) | entero no negativo

Valor mínimo de unicidad, especificado como un entero no negativo.

La función marca el valor de disparidad estimado K para un píxel como no confiable si:

v < V×(1 + 0.01×UniquenessThreshold),

donde V es la suma de la diferencia absoluta (SAD) correspondiente al valor de disparidad K, y v es el valor SAD más pequeño en todo el rango de disparidad, excluyendo K, K –1 y K+1.

Aumentar el valor de UniquenessThreshold da como resultado que la función marque valores de disparidad para más píxeles como no confiables. Para desactivar el umbral de unicidad, establezca este valor en 0.