近日,百度強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)發(fā)布了四足機(jī)器人控制上的最新研究進(jìn)展,采用自進(jìn)化的步態(tài)生成器與強(qiáng)化學(xué)習(xí)聯(lián)合訓(xùn)練,從零開始學(xué)習(xí)并掌握多種運(yùn)動(dòng)步態(tài),一套算法解決包括獨(dú)木橋、跳隔板、鉆洞穴等多種場(chǎng)景控制難題。百度已開源全部仿真環(huán)境和訓(xùn)練代碼,并公開相關(guān)論文。
完整仿真效果和真機(jī)視頻
足式機(jī)器人的控制一直是機(jī)器人控制領(lǐng)域的研究熱點(diǎn),因?yàn)橄啾扔诔R姷妮喪綑C(jī)器人,足式機(jī)器人可以像人類一樣靈活地跨越障礙,極大地?cái)U(kuò)展機(jī)器人的活動(dòng)邊界。波士頓動(dòng)力(Boston Dynamics)此前對(duì)外發(fā)布了其商用的第一款四足機(jī)器人Spot,但是相關(guān)的控制算法一直沒有對(duì)外披露。而市面上商業(yè)產(chǎn)品采用的控制算法,大部分基于麻省理工學(xué)院(MIT)開源的第三代的四足控制算法,需要依賴大量專家經(jīng)驗(yàn)。
近日,百度強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)聯(lián)合小度機(jī)器人團(tuán)隊(duì),基于飛槳機(jī)器人控制算法框架PaddleRobotics,發(fā)布了四足機(jī)器人控制的最新進(jìn)展。該算法首次提出基于自進(jìn)化的步態(tài)生成器來引導(dǎo)強(qiáng)化學(xué)習(xí)訓(xùn)練,通過自主學(xué)習(xí),機(jī)器人能探索出合理的步態(tài)并穿越各種各樣的高難度場(chǎng)景。
這個(gè)算法到底有多厲害,先來一睹為快。
圖一、四足機(jī)器人步態(tài)展示
(注:演示真機(jī)為宇樹四足機(jī)器人產(chǎn)品)
2025-04-24 08:29
2025-04-24 08:26
2025-04-24 08:25
2025-04-24 08:24
2025-04-24 08:24
2025-04-24 08:23
2025-04-24 08:22
2025-04-24 08:21
2025-04-23 11:50
2025-04-23 11:50