Robôs humanoides e seus últimos avanços

09 set 2024
As habilidades adquiridas nas simulações são transferidas para o robô humanoide com Sim2Real (Foto: Unitree)

PESQUISA LOGÍSTICA
Por Jay Huang, Ph.D, Dien Wang, Ph.D e Weibin Liang, Ph.D

Foto: Unitree

Os robôs humanoides, a forma definitiva de autômato com que a humanidade sempre sonhou, parecem estar começando a se tornar uma realidade. A apresentação da Optimus despertou o interesse do público e de gigantes da tecnologia, embora a indústria ainda esteja em fase de prototipagem.

Inspirados na anatomia humana, os três principais elementos dos humanoides são o “cérebro”, destinado ao planeamento de tarefas e movimentos, o “cerebelo”, que os ajuda a manter o equilíbrio e a mover-se suavemente, e o “corpo”, que lhes proporciona a percepção e a capacidade de executar ações. Alguns dos principais desafios que esses robôs enfrentam são prevenir quedas e melhorar sua inteligência para realizar diversas tarefas.

A inteligência artificial (IA) mudou as regras do jogo. Técnicas emergentes, como aprendizagem por reforço, aprendizagem por imitação ou grandes modelos linguísticos (LLM), estão mostrando um caminho promissor para robôs humanoides. Graças ao seu “cerebelo”, podem manter o equilíbrio, evitar interrupções, executar movimentos complexos em mundos virtuais e depois migrar essas habilidades para o mundo real. Os “cerebelos” aprimorados por IA mostram avanços notáveis em áreas como estabilidade e adaptabilidade dos robôs, que constituíam enormes complicações no passado. E se esta região do cérebro é vital, o “cérebro” dos humanoides tem uma relevância ainda maior. A aprendizagem por reforço e imitação é muito promissora para aplicações treinadas de curto prazo. A utilização de grandes modelos de linguagem é atraente, mas, na prática a sua implementação continua a ser um desafio. A teleoperação, em que um robô remoto é controlado por um operador humano, é excelente na coleta de dados de treinamento e pode servir como plano de contingência caso os “cérebros” robóticos não estejam bem preparados no médio prazo.

Antes da incorporação da IA nesse campo, os androides caíam facilmente

Em empresas que desenvolvem humanoides e dos últimos avanços alcançados, a Unitree se destaca na área de “corpo” e “cerebelo”. Embora inicialmente focada em robôs de quatro patas, a empresa fez a transição para o reino bípede e seu humanoide possui capacidades de movimento excepcionais. Por outro lado, o Google DeepMind registou progressos no desenvolvimento do “cérebro” robótico. Está explorando a genAI e outras técnicas além dos grandes modelos tradicionais, e suas pesquisas são baseadas em humanoides simplificados.

Os três elementos cruciais para os humanoides são o “cérebro”, o “cerebelo” e o “corpo”, incluindo os “olhos”, “ouvidos”, “pele”, “músculos” e “ossos”. É claro que os principais aspectos a melhorar dos três são relativamente independentes e podem ser aperfeiçoados em paralelo.

Os humanoides ainda precisam de maior estabilidade antes da implantação (Foto: Unitree)
Foto: Unitree

O “cerebelo”

Tal como acontece com os humanos, o “cerebelo” de um humanoide desempenha um papel fundamental na coordenação das suas articulações, garantindo o equilíbrio e a execução de movimentos suaves.

Fazer os robôs caminharem com estabilidade foi um desafio. Antes da incorporação da IA neste campo, os androides caíam facilmente, sendo até necessário o uso de cabos de segurança para proteger as máquinas mais frágeis. Embora algumas empresas tenham implementado métodos de controle relativamente avançados, como controle de corpo inteiro e controle preditivo de modelo (PMC), com resultados impressionantes, os humanoides ainda não são capazes de se defender de forma eficaz em cenários imprevisíveis. Necessitam de uma otimização mais eficiente para a sua locomoção ou para a execução de tarefas específicas, e o “cerebelo” ainda apresenta obstáculos neste âmbito.

Felizmente, a IA, nomeadamente a aprendizagem por reforço, e as poderosas técnicas de simulação disponíveis hoje podem mudar o jogo. A aprendizagem por reforço é um processo de tentativa e erro no qual os robôs aprendem comportamentos através de interações repetidas com seu ambiente. Os engenheiros programam humanoides com ordens sobre “o que fazer”, mas não lhes dizem “como fazer” para que os autômatos possam encontrar uma solução por conta própria.

A visão artificial ou 3D por meio de scanners LiDAR ou câmeras de profundidade, mãos ágeis e sensores táteis e de pressão são essenciais para o desempenho do humanoide

Para aperfeiçoar esses movimentos, é necessário o uso de simulações, ou seja, ambientes virtuais onde os robôs possam melhorar sua locomoção e execução de tarefas. As competências e conhecimentos adquiridos na simulação virtual podem então ser transferidos para a realidade em infraestruturas conhecidas como Sim2Real. As falhas são inevitáveis nos estágios iniciais, mas eventualmente os robôs encontram uma maneira de superar essas dificuldades.

Embora o futuro pareça promissor, os ambientes de simulação e o Sim2Real também apresentam alguns obstáculos. São plataformas complexas que replicam fenômenos físicos, o que envolve o gerenciamento de aspectos como a dinâmica de corpos rígidos, colisões, fricções e deformações para criar mundos virtuais o mais realistas possível.

Boston Dynamics diminuiu a frequência de queda de seu robô de quatro patas para uma vez a cada 50 quilômetros. Este número é maior entre os bípedes, portanto, apesar de terem feito grandes progressos, os humanoides ainda precisam de maior estabilidade antes de serem amplamente implantados na indústria.

Robô humanoide Optimus Gen-2 de Tesla (publicado sob licença CC BY 3.0 Unported)
Robô humanoide Optimus Gen-2 de Tesla
Publicado sob licença CC BY 3.0 Unported

O “cérebro”

Os pesquisadores ainda estão explorando como tornar os robôs inteligentes o suficiente para realizar diferentes tipos de tarefas. No curto prazo, o problema será resolvido através da aprendizagem por reforço e imitação, e espera-se que grandes modelos linguísticos e modelos end-to-end sejam implementados a longo prazo.

Além de melhorar a movimentação dos robôs, o aprendizado por reforço é útil para treiná-los para tarefas específicas. No entanto, utilizá-lo para alcançar autonomia em ações mais gerais pode demorar muito. É por isso que uma abordagem mais prática é a aprendizagem por imitação, na qual uma pessoa mostra ao humanoide como agir através de sistemas de teleoperação.

A equipe do Google DeepMind propôs a adoção de vários modelos grandes para enfrentar funções de percepção, planejamento e execução. Para conseguir isso, introduziu um modelo integrado de visão-linguagem-ação (VLA) chamado Robotic Transformer 2 (RT-2) para abordar essas três funções principais. Demostraram que o RT-2 pode completar tarefas que exigem a aplicação de raciocínio humano específico, compreensão de símbolos e reconhecimento. Por exemplo, o comando “coloque o morango na tigela correta” exige que o robô entenda o que é uma tigela e o que é uma tigela, mas também que seja capaz de agrupar essa fruta com outras semelhantes.

O “corpo”

Além dos componentes principais como motores e redutores, consideramos que elementos como a visão artificial ou 3D através de scanners LiDAR, ou câmeras de profundidade, mãos ágeis e sensores táteis e de pressão são decisivos para o desempenho dos humanoides. É por isso que acreditamos que serão essenciais para conseguir robôs avançados com funcionalidade ideal.

Tendências emergentes e desafios dos robôs humanoides

Principais módulos de robôs humanoides Tendências tecnológicas Desafios
“Cérebro”
Planejamento de tarefas e movimentos
  • Presente: Aprendizagem por reforço + Aprendizagem por imitação
  • Futuro: Grandes Modelos de Linguagem (LLM)
  • Futuro de longo prazo: ótimos modelos end-to-end
  • Falta de dados para o seu treinamento
  • Incapacidade de assumir certas tarefas
  • Confiabilidade a ser verificada
“Cerebelo”
Coordenação das articulações
  • Passado: Controle Total do Corpo + Controle Preditivo do Modelo (CPM)
  • Presente: Aprendizado por Reforço + Sim2Real*
  • Qualidade de transferência da simulação para o mundo real
  • Adaptabilidade a diferentes ambientes
“Corpo”
Percepção do ambiente e execução do movimento
  • Motores de alta densidade de potência
  • Mãos robóticas flexíveis
  • Sensores de toque e pressão
  • Redução de custos
  • Melhor desempenho de hardware (alta densidade de potência, dinâmica, redução de peso, etc.)

 

Fontes: Academia Chinesa de Ciências, Centro de Inovação de Robôs Humanoides de Pequim, Universidade de Tsinghua e análise de Bernstein.
*Sim2Real, abreviação de “simulação de realidade”, refere-se à transferência de movimentos, habilidades ou conhecimentos de uma simulação virtual para o mundo real.

Implicações na indústria

Nesta era do “renascimento dos robôs”, a IA muitas vezes incorpora recursos para tarefas de localização, identificação e inspeção, mas os robôs industriais ainda carecem de inteligência avançada. Tecnologias emergentes, como a aprendizagem por reforço, a aprendizagem por imitação ou grandes modelos linguísticos, podem revolucionar esta área.

Cientistas já demonstraram a viabilidade do uso conjunto de robôs e inteligência artificial em aspectos como otimizar suas trajetórias e tempos de execução, gerar estratégias para navegar em cenários complexos e simplificar processos de programação. Com um ecossistema de robôs industriais já estabelecido, esperamos que a IA, impulsione a sua adoção num futuro próximo.

 


 

AUTORES DA PESQUISA:

Jay Huang, Ph.D, Dien Wang, Ph.D e Weibin Liang, Ph.D, analistas de pesquisa de Sanford C. Bernstein (Hong Kong) Limited, parte do Société Générale Groupe.

 


 

Publicação original:

Huang, Jay, Wang, Dien, Liang, Weibin. 2024. “Global Automation: The Humanoid Primer”. Bernstein Société Générale Group.

Este artigo foi preparado apenas para investidores institucionais e profissionais e não se destina a investidores particulares ou de varejo. Acesse www.bernsteinresearch.com para manter-se atualizado com os avanços importantes.