Um salto gigante para a mini chita
Um novo sistema de controle, demonstrado usando o mini-cheetah robótico do MIT, permite que robôs de quatro patas saltem em terrenos irregulares em tempo real.
Chita robô no MIT cortesia dos pesquisadores.
Um guepardo saltitante atravessa um campo ondulante, saltando sobre fendas repentinas no terreno acidentado. O movimento pode parecer fácil, mas fazer um robô se mover dessa maneira é uma perspectiva completamente diferente, relata Notícias do MIT .
Nos últimos anos, robôs de quatro patas inspirados no movimento de guepardos e outros animais deram grandes saltos à frente, mas ainda estão atrás de seus colegas mamíferos quando se trata de viajar por uma paisagem com mudanças rápidas de elevação.
Nessas configurações, você precisa usar a visão para evitar falhas. Por exemplo, pisar em uma lacuna é difícil de evitar se você não puder vê-la. Embora existam alguns métodos existentes para incorporar a visão na locomoção com pernas, a maioria deles não é realmente adequada para uso com sistemas robóticos ágeis emergentes, diz Gabriel Margolis, estudante de doutorado no laboratório de Pulkit Agrawal, professor de Ciência da Computação e Laboratório de Inteligência (CSAIL) do MIT.
Agora, Margolis e seus colaboradores desenvolveram um sistema que melhora a velocidade e agilidade de robôs com pernas à medida que saltam através de fendas no terreno. O novo sistema de controle é dividido em duas partes – uma que processa a entrada em tempo real de uma câmera de vídeo montada na frente do robô e outra que traduz essas informações em instruções sobre como o robô deve mover seu corpo. Os pesquisadores testaram seu sistema no mini-cheetah do MIT, um robô poderoso e ágil construído no laboratório de Sangbae Kim, professor de engenharia mecânica.
Ao contrário de outros métodos para controlar um robô de quatro patas, este sistema de duas partes não exige que o terreno seja mapeado com antecedência, para que o robô possa ir a qualquer lugar. No futuro, isso pode permitir que robôs partam para a floresta em uma missão de resposta a emergências ou subam um lance de escadas para entregar medicamentos a um idoso recluso.
Margolis escreveu o artigo com o autor sênior Pulkit Agrawal, que dirige o laboratório de IA Improvável no MIT e é Steven G. e Renee Finn Professor Assistente de Desenvolvimento de Carreira no Departamento de Engenharia Elétrica e Ciência da Computação; Professor Sangbae Kim no Departamento de Engenharia Mecânica do MIT; e colegas de pós-graduação Tao Chen e Xiang Fu no MIT. Outros co-autores incluem Kartik Paigwar, estudante de pós-graduação da Arizona State University; e Donghyun Kim, professor assistente da Universidade de Massachusetts em Amherst. O trabalho será apresentado no próximo mês na Conferência sobre Robot Learning.
Está tudo sob controle
O uso de dois controladores separados trabalhando juntos torna este sistema especialmente inovador.
Um controlador é um algoritmo que converterá o estado do robô em um conjunto de ações a serem seguidas. Muitos controladores cegos - aqueles que não incorporam visão - são robustos e eficazes, mas apenas permitem que os robôs andem em terreno contínuo.
A visão é uma entrada sensorial tão complexa para processar que esses algoritmos são incapazes de lidar com isso de forma eficiente. Os sistemas que incorporam a visão geralmente contam com um mapa de altura do terreno, que deve ser pré-construído ou gerado em tempo real, um processo que normalmente é lento e propenso a falhas se o mapa de altura estiver incorreto.
Para desenvolver seu sistema, os pesquisadores pegaram os melhores elementos desses controladores robustos e cegos e os combinaram com um módulo separado que lida com a visão em tempo real.
A câmera do robô captura imagens de profundidade do terreno próximo, que são alimentadas a um controlador de alto nível junto com informações sobre o estado do corpo do robô (ângulos das articulações, orientação do corpo, etc.). O controlador de alto nível é um rede neural que aprende com a experiência.
Essa rede neural gera uma trajetória de destino, que o segundo controlador usa para criar torques para cada uma das 12 articulações do robô. Esse controlador de baixo nível não é uma rede neural e, em vez disso, depende de um conjunto de equações físicas concisas que descrevem o movimento do robô.
A hierarquia, incluindo o uso desse controlador de baixo nível, nos permite restringir o comportamento do robô para que ele se comporte melhor. Com esse controlador de baixo nível, estamos usando modelos bem especificados aos quais podemos impor restrições, o que geralmente não é possível em uma rede baseada em aprendizado, diz Margolis.
Ensinando a rede
Os pesquisadores usaram o método de tentativa e erro conhecido como aprendizado por reforço para treinar o controlador de alto nível. Eles realizaram simulações do robô correndo em centenas de diferentes terrenos descontínuos e recompensou-o por travessias bem sucedidas.
Com o tempo, o algoritmo aprendeu quais ações maximizaram a recompensa.
Em seguida, eles construíram um terreno físico e aberto com um conjunto de tábuas de madeira e testaram seu esquema de controle usando a mini chita.
Foi definitivamente divertido trabalhar com um robô que foi projetado internamente no MIT por alguns de nossos colaboradores. A mini chita é uma ótima plataforma porque é modular e feita principalmente de peças que você pode encomendar online, então se quiséssemos uma nova bateria ou câmera, era apenas uma questão de encomendá-la de um fornecedor regular e, com um pouco ajuda do laboratório de Sangbae, instalando-o, diz Margolis.
Estimar o estado do robô provou ser um desafio em alguns casos. Ao contrário da simulação, os sensores do mundo real encontram ruídos que podem se acumular e afetar o resultado. Assim, para alguns experimentos que envolveram o posicionamento de pés de alta precisão, os pesquisadores usaram um sistema de captura de movimento para medir a verdadeira posição do robô.
Seu sistema superou outros que usam apenas um controlador, e a mini chita cruzou com sucesso 90% dos terrenos.
Uma novidade do nosso sistema é que ele ajusta a marcha do robô. Se um humano estivesse tentando pular uma lacuna muito grande, ele poderia começar correndo muito rápido para aumentar a velocidade e, em seguida, colocar os dois pés juntos para dar um salto realmente poderoso através da lacuna. Da mesma forma, nosso robô pode ajustar os tempos e a duração de seus contatos com os pés para melhor atravessar o terreno, diz Margolis.
Saindo do laboratório
Embora os pesquisadores tenham demonstrado que seu esquema de controle funciona em laboratório, eles ainda têm um longo caminho a percorrer antes que possam implantar o sistema no mundo real, diz Margolis.
No futuro, eles esperam montar um computador mais poderoso no robô para que ele possa fazer toda a computação a bordo. Eles também querem melhorar o estimador de estado do robô para eliminar a necessidade do sistema de captura de movimento. Além disso, eles gostariam de melhorar o controlador de baixo nível para que ele possa explorar toda a amplitude de movimento do robô e aprimorar o controlador de alto nível para que funcione bem em diferentes condições de iluminação.
É notável testemunhar a flexibilidade das técnicas de aprendizado de máquina capazes de contornar processos intermediários cuidadosamente projetados (por exemplo, estimativa de estado e planejamento de trajetória) nos quais as técnicas baseadas em modelos seculares têm confiado, diz Kim. Estou empolgado com o futuro dos robôs móveis com processamento de visão mais robusto e treinado especificamente para locomoção.
A pesquisa é apoiada, em parte, pelo Improbable AI Lab do MIT, Biomimetic Robotics Laboratory, NAVER LABS e o DARPA Machine Common Sense Program.
Republicado com permissão de Notícias do MIT . Leia o artigo original .
Neste artigo, robótica de inovação em tecnologia emergenteCompartilhar: