Investigadores de la Universidad Politécnica de Madrid (UPM) desarrollan sistemas para la coordinación y comunicación de sistemas multi-robot que se adapten al entorno y aprendan durante todo su ciclo de vida.
Un grupo de investigación de la Universidad Politécnica de Madrid (UPM) está desarrollando un sistema para la coordinación y comunicación de sistemas multi-robot. Para ello utilizan métodos bio-inspirados, algoritmos evolutivos y aprendizaje por refuerzo para que los robots se adapten al entorno y aprendan durante todo su ciclo de vida. Además, están trabajando en la evolución autónoma de un lenguaje para equipos de robots. Estas habilidades servirían para aplicaciones en el campo del transporte, la vigilancia o la localización en catástrofes.
Con el objetivo de aportar soluciones desde la experiencia en otros ámbitos más tradicionales de la robótica como la industrial y la autónoma, el Grupo de Investigación de Percepción Computacional y Robótica de la UPM en colaboración con investigadores de las universidades de A Coruña y el País Vasco ha abordado el proyecto McRobs.
El proyecto se centra en el diseño y desarrollo de una arquitectura de sistemas modulares multi-componente que contempla los aspectos de control, el diseño estructural (incluyendo cinemática y dinámica) así como los mecanismos de monitorización, navegación y coordinación.
Así ha surgido ANLAGIS (Adaptive Neuron-like network of Granular and Learning Automata System), una arquitectura de control de sistemas robóticos que propone el uso de métodos evolutivos y también basados en aprendizaje automático, concretamente, aprendizaje por refuerzo, para sintonizar modelos de neuronas y autómatas probabilísticos, donde el espacio de estados se granulariza mediante técnicas borrosas y de umbral.
Estos métodos se han empleado en la coordinación de equipos de robots para realizar tareas cooperativas y competitivas de forma coordinada (interceptación, coordinación de movimientos, construcción cooperativa de mapas del entorno) que serían muy útiles, por ejemplo, en aplicaciones de transporte de materiales y vigilancia de zonas.
También se está trabajando en la línea de la robótica modular, ya que en ocasiones es interesante que varios robots, componentes o módulos se unan para crear un nuevo robot o módulo con una estructura y forma determinada que permita acceder a sitios que de otra forma no sería posible o que facilite la realización de ciertas tareas.
En esta última línea, se han propuesto métodos que permiten reducir la complejidad al establecer los modelos cinemáticos de cadenas articuladas, aplicándolos a la locomoción de robots serpenoides. Esta línea también es muy interesante ya que tiene una aplicación directa en tareas de localización en catástrofes o vigilancia de espacios no estructurados.
Actualmente, los investigadores de la UPM están estudiando la emergencia y evolución del lenguaje en equipos de robots. El objetivo que se persigue es el de demostrar si un conjunto de robots puede crear de forma autónoma un lenguaje que sirva para comunicarse entre ellos marcas o lugares de un entorno que no se hayan considerado en tiempo de diseño. Por ejemplo, si un equipo de robots pueden llegar a nombrar defectos o áreas de acumulación de basura en sus zonas de vigilancia.
El proyecto McRobs ha sido financiado por el Plan Nacional de I+D+i y algunos resultados y conclusiones de sus líneas de trabajo han sido publicadas en revistas científicas como Information Science y Neurocomputing, y en también en congresos internacionales.
-----------------------
Referencias bibliográficas:
Quinonez, Y., de Lope, J., Maravall, D.. Cooperative and Competitive Behaviors in a Multi-robot System for Surveillance Tasks. COMPUTER AIDED SYSTEMS THEORY - EUROCAST 2009. Book Series: Lecture Notes in Computer Science, 5717, 437-444 (2009).
Sanz, Yolanda, de Lope, J., Maravall, D. Applying Reinforcement Learning to Multi-robot System Behavior Coordination. COMPUTER AIDED SYSTEMS THEORY - EUROCAST 2009 Book Series: Lecture Notes in Computer Science 5717, 413-420, (2009).