Summary: | Este trabalho apresenta uma solução para o problema de coordenação dos atuadores das pernas de robôs móveis levando em consideração múltiplos critérios. É assumido que a posição no tempo de cada atuador é descrita por uma função periódica a ser determinada iterativamente por um algoritmo de aprendizado por reforço. As pernas similares do robô são identificadas e agrupadas visando diminuir o número de funções que precisam ser determinadas. O desempenho do robô simulado é medido considerando: a) as velocidades de translação frontal e de rotação, b) a suavidade na locomoção do robô e c) o máximo torque e o consumo de energia dos atuadores. Também é investigada a utilização da transferência de conhecimento no intuito de agilizar o aprendizado em duas situações específicas: na acomodação a uma falha ocorrida e no aprendizado por partes, onde os critérios desejados para o modo de caminhar são inseridos gradativamente no aprendizado. As funções determinadas no ambiente de simulação pelo algoritmo de reforço são, então, usadas nos atuadores do robô real construído usando o kit de robótica educacional Bioloid Comprehensive Kit. O desempenho do robô real é, então, medido e comparado com o desempenho do robô simulado. Este trabalho apresenta quatro estudos de caso: um robô quadrúpede, um quadrúpede híbrido (com rodas livres acopladas aos pés), um trípode e um robô bípede. As soluções obtidas pela aplicação do método proposto são apresentadas e se mostram satisfatórias.
|