近日,百度強化學習團隊發(fā)布了四足機器人控制上的最新研究進展,采用自進化的步態(tài)生成器與強化學習聯(lián)合訓練,從零開始學習并掌握多種運動步態(tài),一套算法解決包括獨木橋、跳隔板、鉆洞穴等多種場景控制難題。百度已開源全部仿真環(huán)境和訓練代碼,并公開相關論文。
完整仿真效果和真機視頻
足式機器人的控制一直是機器人控制領域的研究熱點,因為相比于常見的輪式機器人,足式機器人可以像人類一樣靈活地跨越障礙,極大地擴展機器人的活動邊界。波士頓動力(Boston Dynamics)此前對外發(fā)布了其商用的第一款四足機器人Spot,但是相關的控制算法一直沒有對外披露。而市面上商業(yè)產(chǎn)品采用的控制算法,大部分基于麻省理工學院(MIT)開源的第三代的四足控制算法,需要依賴大量專家經(jīng)驗。
近日,百度強化學習團隊聯(lián)合小度機器人團隊,基于飛槳機器人控制算法框架PaddleRobotics,發(fā)布了四足機器人控制的最新進展。該算法首次提出基于自進化的步態(tài)生成器來引導強化學習訓練,通過自主學習,機器人能探索出合理的步態(tài)并穿越各種各樣的高難度場景。
這個算法到底有多厲害,先來一睹為快。
圖一、四足機器人步態(tài)展示
(注:演示真機為宇樹四足機器人產(chǎn)品)
2025-04-24 08:29
2025-04-24 08:26
2025-04-24 08:25
2025-04-24 08:24
2025-04-24 08:24
2025-04-24 08:23
2025-04-24 08:22
2025-04-24 08:21
2025-04-23 11:50
2025-04-23 11:50