Google estabelece estrutura para robôs autônomos de execução de recados de tratamento de artrite reumatóide de risco na Índia

“Somente nos Estados Unidos, há três milhões de pessoas com problemas de mobilidade que os impedem de sair de suas casas”, escreveu o pesquisador sênior Aleksandra Faust e o engenheiro de software de robótica da Atlanta, Anthony Francis. “[Máquinas poderiam] melhorar a independência de pessoas com mobilidade limitada, por exemplo, trazendo mantimentos, remédios e pacotes.”

Como? Em parte, usando o aprendizado por reforço (RL), uma técnica de treinamento em IA significa artrite reumatoide em telugu que emprega recompensas para direcionar os agentes em direção aos objetivos. Faust, Francis e colegas combinaram RL com planejamento de longo prazo para produzir agentes planejadores que podem atravessar curtas distâncias (até 15 metros) com segurança artrose, sem colidir com obstáculos em movimento.

Eles utilizaram o AutoRL, uma ferramenta que automatiza a pesquisa de recompensas de RL e arquiteturas de redes neurais, para treinar esses agentes em um ambiente simulado. Em seguida, eles usaram os agentes meloxicam de medicação para artrite treinados para construir roteiros, ou gráficos que compreendem nós (locais) e bordas que se conectam aos nós somente se esses agentes puderem atravessar entre eles de forma confiável.

É mais fácil falar do que fazer; Como os pesquisadores apontam, os agentes de treinamento com abordagens tradicionais de RL apresentam muitos desafios. Requer tempo para iterar e osteoartrite adualizar recompensas manuais e tomar decisões mal informadas sobre as arquiteturas de IA, sem mencionar a mitigação do “catastrófico esquecimento”, um fenômeno no qual os sistemas de IA esquecem abruptamente as informações aprendidas anteriormente ao aprender novas informações.

O AutoRL tenta resolver isso em duas fases: pesquisa de recompensa e pesquisa de arquitetura de rede neural. Durante o primeiro estágio, ele treina agentes ao longo de várias gerações, cada um com funções de recompensa ligeiramente diferentes. No final da fase, a recompensa artrite reumatóide que significa em hindi que leva a cirurgia do polegar osteoartrite agente para o seu destino mais frequentemente é selecionado. A fase de pesquisa da arquitetura de rede neural é uma repetição da primeira fase, essencialmente, mas usando a recompensa selecionada para ajustar a rede e otimizar a recompensa cumulativa.

O processo não é particularmente eficiente – o treinamento do AutoRL em mais de dez gerações de 100 agentes requer cinco bilhões de amostras, ou 32 anos de treinamento. Mas, mais importante, é automatizado. Os modelos não experimentam um desastre catastrófico, e as políticas resultantes são de “qualidade superior” em comparação com o inchaço da artrite da técnica anterior em mãos (até 26% melhor em tarefas de navegação). Eles são robustos o suficiente para guiar robôs por ambientes não estruturados, ou seja, ambientes que nunca viram antes.

As políticas que o AutoRL produz são ótimas para a navegação local, mas e o yoga de longo alcance para a artrite na navegação de mãos? É aí que entram os roteiros probabilísticos. Eles são uma subcategoria de planejadores baseados em amostragem (que aproximam movimentos de robôs) que mostram poses de robô e conectam-nos a “transições viáveis”, criando roteiros ajustados à artrite do ombro direito e 10 habilidades e geometria únicas de um robô. Combinados com planejadores locais baseados em RL e AutoRL sintonizados a mão, eles podem ser usados ​​para treinar robôs, uma vez que o centro local de artrite da ribeira e, posteriormente, adaptados a diferentes ambientes.

“Primeiro, para cada robô, treinamos uma política de planejador local em um ambiente de treinamento simulado genérico”, explica Faust e Francis. “Em seguida, criamos um PRM com relação a essa política, chamado de PRM-RL, em uma planta baixa para o ambiente de implementação. A mesma planta baixa pode ser usada para qualquer robô ayurveda de cura de artrite reumatóide que desejamos implantar no edifício de uma vez por robô + configuração de ambiente. ”

Para avaliar o PRM-RL, os pesquisadores do Google construíram um roteiro usando mapas de escritórios até 200 vezes maiores que os ambientes de treinamento, e aceitaram bordas com pelo menos 90% de sucesso em 20 tentativas. Em comparação com outros métodos em distâncias de 100 metros, os sintomas de espondiloartrite PRM-RL tiveram 2 a 3 vezes a taxa de sucesso em relação aos valores basais. E em testes do mundo real com vários robôs e locais reais de construção, as máquinas eram artríticas significando em telugu “muito robustas” – exceto perto de áreas desordenadas na borda do mapa.

“Podemos conseguir isso desenvolvendo uma autonomia robótica de fácil adaptação, incluindo métodos que podem ser implantados em novos ambientes usando informações já disponíveis”, escreveram Faust e Francis. “Isso é feito automatizando o aprendizado de comportamentos básicos de navegação de curto alcance com o AutoRL e usando essas políticas aprendidas em conjunto com mapas SLAM para criar luvas de artrite de roteiros… O resultado é uma política que, uma vez treinada, pode ser usada em diferentes ambientes e pode produzir um roteiro personalizado para o robô em particular. ”