蹣跚學(xué)步的孩童,學(xué)會(huì)了跌倒后如何站起來(lái),慢慢感受平衡,最終學(xué)會(huì)用雙腿走路,這個(gè)過(guò)程很大程度上是通過(guò)反復(fù)試驗(yàn)學(xué)會(huì)的。但是,波士頓動(dòng)力公司的Spot和Atlas等機(jī)器人并不是這樣的,他們被精心編碼處理特定的任務(wù),結(jié)果可能會(huì)非常好,但是在軟件編程沒(méi)有設(shè)計(jì)到情況下,機(jī)器人可能就會(huì)無(wú)所適從。據(jù)國(guó)外媒體1月6日消息,來(lái)自中國(guó)浙江大學(xué)和英國(guó)愛(ài)丁堡大學(xué)的一個(gè)聯(lián)合研究小組稱(chēng),他們開(kāi)發(fā)出了更好的方式來(lái)解決這樣的問(wèn)題。
在最近發(fā)表在《科學(xué)機(jī)器人》雜志上的一篇論文中,聯(lián)合研究小組詳細(xì)介紹了一種人工智能強(qiáng)化方法,他們用這種方法讓自己的機(jī)器狗“絕影”學(xué)會(huì)如何走路和自主從跌倒中恢復(fù)過(guò)來(lái)。該團(tuán)隊(duì)表示,他們首先在模擬環(huán)境中通過(guò)軟件訓(xùn)練虛擬機(jī)器人。這個(gè)軟件由八名經(jīng)過(guò)培訓(xùn)以掌握特定技能的AI“專(zhuān)家”組成,例如,一個(gè)“專(zhuān)家”訓(xùn)練機(jī)器人流利的行走,而另一個(gè)訓(xùn)練機(jī)器人如何保持平衡。每次虛擬機(jī)器人成功完成一項(xiàng)任務(wù)時(shí),團(tuán)隊(duì)都會(huì)以虛擬積分獎(jiǎng)勵(lì)它。這個(gè)過(guò)程聽(tīng)起來(lái)與Google最近用來(lái)訓(xùn)練MuZero算法的方法相同。
當(dāng)八種專(zhuān)項(xiàng)技能培訓(xùn)完成后,研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)額外的神經(jīng)網(wǎng)絡(luò),有些類(lèi)似于運(yùn)動(dòng)隊(duì)伍中的總教練管理,它將管理其他八種專(zhuān)項(xiàng)技能,在特定的情況下,還會(huì)根據(jù)需要對(duì)一種或者多種技能進(jìn)行優(yōu)先排序。最后,研究團(tuán)隊(duì)會(huì)將軟件移植到原型機(jī)器人上進(jìn)行實(shí)際測(cè)試。
論文作者之一李志斌(音)表示,他們研究的目標(biāo)是創(chuàng)造更加智能化的機(jī)器人,這種機(jī)器人能夠在行進(jìn)中更加靈活地根據(jù)實(shí)際情況自適應(yīng)選擇技能,以便于處理未經(jīng)訓(xùn)練過(guò)的任務(wù)內(nèi)容。目前,該團(tuán)隊(duì)面臨的挑戰(zhàn)之一是如何減少模擬機(jī)器人訓(xùn)練所需要的計(jì)算力,這樣研究才更具有實(shí)用性?xún)r(jià)值。
2025-04-24 15:08
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57