Esta página fue traducida automáticamente.
Complete una encuesta de 1 minuto sobre la calidad de esta traducción.
Confianza en la habilidad de robots para transitar entornos desconocidos
Nuevo algoritmo optimiza la percepción robótica
Cuando Vasileios Tzoumas, un científico investigador del Instituto Tecnológico de Massachusetts (MIT), visita una nueva ciudad, le gusta explorarla saliendo a correr. Y a veces se pierde. Hace unos años, durante un largo viaje por Osaka para una conferencia, ocurrió lo inevitable. Tzoumas vio la tienda 7-Eleven y recordó haber pasado poco después de salir del hotel. Este reconocimiento permitió “cerrar el circuito” mentalmente, conectar el extremo suelto de su trayectoria con un lugar conocido y del que estaba seguro, consolidando así su mapa mental y permitiéndole regresar al hotel.
El algoritmo de no convexidad gradual (GNC) podría ayudar a las máquinas a transitar por tierra, agua, aire y espacio y regresar al lugar de inicio.
Cerrar el circuito es un término técnico que describe lo que robots hacen con frecuencia cuando transitan por nuevos entornos. Es parte de un proceso denominado Localización y mapeo simultáneos (SLAM). SLAM no es un concepto nuevo. Se utiliza en aspiradoras robóticas, vehículos autónomos, drones de rescate aéreo y robots en fábricas, almacenes y minas. A medida que los dispositivos y vehículos autónomos transitan por entornos nuevos, desde una sala de estar hasta el cielo, construyen un mapa a medida que se desplazan. También deben determinar dónde se encuentran en el mapa utilizando sensores como cámaras, GPS y LiDAR.
A medida que SLAM encuentra más aplicaciones, es más importante que nunca garantizar que los algoritmos de SLAM produzcan resultados correctos en condiciones del mundo real. Los algoritmos de SLAM a menudo funcionan bien con sensores perfectos o en condiciones de laboratorio controladas, pero fallan cuando se implementan con sensores imperfectos del mundo real. No es sorprendente que muchos clientes industriales a menudo se pregunten si pueden confiar en esos algoritmos.
Los investigadores del MIT han desarrollado varios algoritmos de SLAM robustos, así como métodos para demostrar matemáticamente el nivel de confianza. El laboratorio de Luca Carlone, profesor asistente del Leonardo Career Development en MIT, publicó un artículo sobre su algoritmo de no convexidad gradual (GNC), que reduce incertidumbres y errores aleatorios en los resultados de SLAM. Más importante aún, el algoritmo genera resultados correctos mientras que los métodos existentes fallan. El artículo de Carlone, Tzoumas, y Heng Yang y Pasquale Antonante, estudiantes de Carlone, recibió el premio al mejor artículo en visión robótica en la Conferencia Internacional sobre Robótica y Automatización (ICRA). El algoritmo de no convexidad gradual (GNC) podría ayudar a las máquinas a transitar por tierra, agua, aire y espacio, y regresar al lugar de inicio.
Todo está alineado
La percepción de los robots se basa en sensores que a menudo proporcionan entradas con ruido o erróneas. El algoritmo de GNC del MIT permite al robot decidir en qué puntos de datos confiar y cuáles descartar. Una aplicación del algoritmo de GNC se denomina alineación de formas. Un robot estima la ubicación y orientación 3D de un automóvil utilizando imágenes de cámara 2D. El robot recibe una imagen de cámara con muchos puntos etiquetados por un algoritmo de detección de características, como faros, ruedas, espejos. También tiene un modelo 3D de un automóvil en su memoria. El objetivo es escalar, rotar y colocar el modelo 3D para que sus características se alineen con las características de la imagen. "Esto es fácil si el algoritmo de detección de características ha hecho su trabajo perfectamente, pero rara vez es el caso", dice Carlone. En aplicaciones del mundo real, el robot se enfrenta a muchos valores atípicos (características mal etiquetadas) que pueden representar más del 90% de todas las observaciones. Ahí es donde entra en juego el algoritmo de GNC y supera a otras opciones.
Los robots resuelven este problema utilizando una función matemática que tiene en cuenta la distancia entre cada par de características (por ejemplo, el faro derecho en la imagen y el faro derecho en el modelo). Intentan “optimizar” la función de orientar el modelo de manera que se minimicen todas esas distancias. Cuanto más funcionalidades, más difícil es el problema.
Una forma de resolverlo es probar todas las soluciones posibles a la función y ver cuál funciona mejor, pero hay demasiadas para probar. Un método más común, explican Yang y Antonante, “es probar una solución y seguir probándola (por ejemplo, que los faros del modelo estén más alineados con los de la imagen 2D) hasta que ya no se pueda mejorar”. Debido a los datos con ruido, no será perfecto (quizás los faros se alineen, pero no las ruedas), por lo que puede probar otra solución y refinarla tanto como sea posible, repitiendo el proceso varias veces hasta encontrar el mejor resultado. Aun así, las posibilidades de encontrar la mejor solución posible son escasas.
En aplicaciones del mundo real, el robot se enfrenta a muchos valores atípicos que pueden representar más del 90% de todas las observaciones. Ahí es donde entra en juego el algoritmo de GNC y supera a otras opciones.
La idea detrás de GNC es primero simplificar el problema. Reducir la función que intentan optimizar (que describe las diferencias entre el modelo 3D y la imagen 2D) a una que tiene una única solución óptima. Cuando se elige una solución y se perfecciona, eventualmente se encuentra la mejor solución. Luego se reintroduce un poco de complejidad de la función original y se refina la solución que se acaba de encontrar. Y se continua hasta que se encuentra la solución óptima para la función original. Y los faros están bien alineados, al igual que las ruedas y los paragolpes.
Repetir el proceso
El artículo aplica el algoritmo de GNC a la alineación de formas y SLAM, entre otros problemas. En el caso de SLAM, el robot utiliza datos de sensores para determinar su trayectoria anterior y crear un mapa. Por ejemplo, un robot que transita por un complejo de oficinas captura datos de odometría que registra qué distancia y en qué dirección ha ido entre las 8:00 am y las 8:15 am, entre las 8:15 am y las 8:30 am, y así sucesivamente. También cuenta con datos de LiDARy cámaras a las 8:00 am, 8:15 am, etc. En algún momento, cerrará el circuito y verá lo mismo en dos momentos diferentes, como le pasó a Tzoumas cuando pasó corriendo otra vez por la tienda 7-Eleven.
Los investigadores descubrieron que el algoritmo de GNC era más preciso que las técnicas más modernas y podía manejar un mayor porcentaje de valores atípicos.
Como con la alineación de formas, se trata de un problema de optimización. Yang, el primer autor del artículo, explica: “Con SLAM, en lugar de alinear las características para que coincidan con un modelo 3D, el sistema curva la trayectoria que ha recorrido para alinear los objetos en el mapa”. En primer lugar, el sistema trabaja para minimizar las diferencias entre los recorridos percibidos por diferentes sensores, ya que es probable que cada sensor tenga errores en las mediciones. Por ejemplo, si el odómetro del robot muestra que recorrió 100 metros entre las 8:00 a. m. y las 8:15 a. m., la trayectoria actualizada según las mediciones del LiDAR y la cámara debería reflejar esa distancia, o un valor parecido. El sistema también minimiza las distancias entre ubicaciones que parecen ser el mismo lugar. Si el robot vio la misma tienda 7-Eleven a las 8:00 am y a las 10:00 am, el algoritmo intentará curvar la trayectoria recordada (ajustando cada rueda) para que sus posiciones recordadas en los momentos de las 8:00 am y de las 10:00 am se alineen, cerrando el circuito.
Mientras tanto, el algoritmo identifica y descarta valores atípicos (puntos de datos erróneos, en los que creía que repetía sus pasos pero no lo hacía), así como características mal etiquetadas en la alineación de formas. No es buena idea llegar a una conclusión errónea. Tzoumas recuerda una ocasión en que, mientras corría por los bosques de Maine, pasó junto a varios troncos caídos que le resultaron familiares. Pensó que había cerrado el circuito y tomo ese punto como referencia y tomé el camino equivocado. Sólo después de no encontrar paisaje familiar por 20 minutos, se dio cuenta del error y regresó.
Una trayectoria recordada antes de la optimización es como una madeja de lana enredada. Después de desenredarse, se asemeja a un conjunto de líneas rectas que reflejan los caminos que atravesó el robot. El término técnico para este proceso de SLAM es optimización de gráficos de pose.
En el artículo, los investigadores compararon su algoritmo de GNC con otros algoritmos en varias aplicaciones, como alineación de formas y optimización de gráficos de pose. Descubrieron que su método era más preciso que las técnicas más modernas y podía manejar un mayor porcentaje de valores atípicos. En el caso de SLAM, funcionó aun cuando tres de cada cuatro cierres de circuito eran erróneos, lo que supone muchos más valores atípicos de los que se encontrarían en una aplicación del mundo real. Es más, su método suele ser más eficiente que otros algoritmos y requiere menos pasos computacionales. Tzoumas dice: “Una de las dificultades fue encontrar un algoritmo de propósito general que funcione bien en muchas aplicaciones”. Yang dice que lo han probado en más de 10. Al final, dice Tzoumas, encontraron el “punto óptimo”.
Pasar de la investigación a la producción es un paso importante para que los resultados de la investigación marquen una diferencia a gran escala, afirma Roberto G. Valenti, científico investigador en robótica de MathWorks. MathWorks ha estado trabajando con el laboratorio de Carlone para integrar los algoritmos de GNC en MATLAB como parte de Navigation Toolbox™, que las empresas utilizan para implementar SLAM en sistemas autónomos comerciales e industriales.
Solucionar problemas
El laboratorio de Carlone está trabajando en formas de ampliar las capacidades de su algoritmo de GNC. Por ejemplo, Yang planea diseñar algoritmos de percepción que puedan certificarse como correctos. Y Antonante busca formas de gestionar la incongruencia entre diferentes algoritmos: Si el módulo de SLAM de un vehículo autónomo dice que la carretera sigue recta, pero el módulo de detección de carril dice que gira a la derecha, tenemos un problema.
El algoritmo de GNC es el nuevo punto de referencia que permite a los robots detectar sus propios errores.
Tzoumas está estudiando cómo ampliar no sólo la interacción entre múltiples algoritmos en un robot, sino la colaboración entre múltiples robots. En trabajos anteriores, programó drones para realizar un seguimiento de objetivos, como delincuentes a pie o en automóvil. En el futuro, es posible que varias máquinas puedan ejecutar el algoritmo de GNC de forma conjunta. Cada uno aportaría información parcial a sus compañeros y juntos construirían un mapa global de ubicaciones en la Tierra o en otros lugares. Este año, Tzoumas trabajará en el departamento de ingeniería aeroespacial de la Universidad de Michigan en autonomía confiable para la planificación y la autonavegación de múltiples robots, incluso en entornos difíciles, como campos de batalla y otros planetas.
“No saber cómo se comportarán la IA y los algoritmos de percepción es un gran impedimento para su uso”, afirma Antonante. Señala que nadie confiará en guías de turismo robóticos si existe la posibilidad de que choquen con los visitantes: “El sistema debe conocer profundamente su entorno y a sí mismo, para que pueda detectar sus propios errores”. El algoritmo de GNC es el nuevo punto de referencia que permite a los robots detectar sus propios errores y, lo más importante, como dice Tzoumas, “ayuda a solucionar problemas”.
Artículos destacados sobre robótica
Más casos prácticos
ACADEMIA / IA
IA revela secretos de artefactos antiguos
Uso de Deep Learning y procesamiento de imágenes para restaurar y preservar obras de arte
TECNOLOGÍA ECOLÓGICA / SISTEMAS DE CONTROL
Eliminación de millones de toneladas de emisiones de CO2 anuales en puertos marítimos
Electrificación de vehículos comerciales con pilas de combustible de hidrógeno
STEM / ACADEMIA
Asentando las bases para futuras carreras en CTIM
Estudiante de secundaria descubre que la codificación implica mucho más que una pantalla de computadora