- Os robôs ainda falham rapidamente após serem removidos de ambientes de fábrica previsíveis
- Microsoft Rho-alpha vincula diretamente a compreensão da linguagem ao controle de movimento robótico
- O sentido do tato é fundamental para preencher a lacuna entre o software e a ação física
Há muito tempo que os robôs operam de forma confiável em ambientes industriais controlados, com ambientes previsíveis e desvios limitados, mas, fora disso, muitas vezes enfrentam dificuldades.
Para aliviar este problema, a Microsoft anunciou Rho-alpha, o primeiro modelo robótico derivado da série de linguagem visual Phi, argumentando que os robôs precisam de melhores maneiras de ver e compreender as instruções.
A empresa acredita que os sistemas podem operar além das linhas de montagem, respondendo às mudanças nas condições, em vez de seguir roteiros rígidos.
O que Rho-alpha foi projetado para fazer
A Microsoft vincula isso ao que geralmente é chamado de IA física, onde se espera que modelos de software guiem as máquinas em situações não estruturadas.
Combina linguagem, percepção e ação, o que reduz a dependência de linhas de produção ou instruções fixas.
Rho-alpha traduz comandos de linguagem natural em sinais de controle robóticos e se concentra em tarefas de manipulação bimanuais que exigem coordenação e controle precisos entre dois braços robóticos.
A Microsoft afirma que o sistema estende as abordagens tradicionais do VLA, expandindo a percepção e as entradas de aprendizagem.
“O surgimento de padrões de ação de linguagem visual (VLA) para sistemas físicos permite que os sistemas percebam os humanos de forma cada vez mais autônoma em ambientes não estruturados”, disse Ashley Llorens, vice-presidente corporativo e diretor administrativo do Microsoft Research Accelerator.
Rho-alfa inclui o sentido do tato junto com a visão, com modalidades sensoriais adicionais, como força, que é um desenvolvimento contínuo.
Estas escolhas de design sugerem um esforço para preencher a lacuna entre a inteligência simulada e a interação física, embora a sua eficácia ainda precise ser avaliada.
Uma parte importante da abordagem da Microsoft é baseada em simulação para lidar com dados limitados em robótica de grande escala, especialmente dados táteis.
Trajetórias sintéticas são geradas usando aprendizado de reforço Nvidia Isaac Sim e depois combinadas com demonstrações físicas de conjuntos de dados comerciais e abertos.
“Treinar modelos subjacentes que possam raciocinar e agir requer superar a escassez de diversos dados do mundo real”, disse Deepu Talla, vice-presidente de Robótica e Edge AI da Nvidia.
“Ao aproveitar o NVIDIA Isaac Sim Azure para criar conjuntos de dados sintéticos fisicamente precisos, a Microsoft Research está acelerando o desenvolvimento de modelos versáteis como o Rho-alpha, que podem dominar tarefas complexas de manipulação.”
A Microsoft também enfatiza a intervenção humana corretiva durante a implementação, permitindo que os operadores intervenham utilizando dispositivos de teleoperação e forneçam feedback que o sistema pode aprender ao longo do tempo.
Este ciclo de treinamento combina simulação, dados do mundo real e correção humana, refletindo uma dependência crescente de ferramentas de IA para compensar conjuntos de dados deficientes.
O professor Abhishek Gupta, professor assistente da Universidade de Washington, disse: “Embora a geração de dados de treinamento usando sistemas robóticos teleoperados tenha se tornado uma prática comum, há muitos ambientes onde a teleoperação é impossível ou impossível”.
“Estamos trabalhando com a Microsoft Research para enriquecer conjuntos de dados de pré-treinamento coletados de robôs físicos com diferentes evidências sintéticas usando uma combinação de simulação e aprendizado por reforço.”
Siga o TechRadar no Google Notícias e adicione-nos como sua fonte padrão para receber notícias, opiniões e opiniões de nossos especialistas em feeds. Certifique-se de clicar no botão Continuar!
E é claro que você também pode Siga o TechRadar no TikTok para receber notícias, análises, unboxings de vídeos e receber atualizações nossas WhatsApp também









