機器人技術面臨的一大挑戰是,必須投入大量精力針對每個機器人、任務和環境訓練機器學習模型。現在,由谷歌 DeepMind 和其他 33 家研究機構聯合開展的一個新項目旨在通過創建一個通用的人工智能系統來應對這一挑戰,該系統可以與不同類型的物理機器人協同工作,并執行多種任務。
谷歌機器人技術公司高級軟件工程師潘納格-桑凱蒂(Pannag Sanketi)告訴 VentureBeat:"我們觀察到,機器人是很好的專家,但卻是很差的通才。"通常情況下,你必須針對每項任務、機器人和環境訓練一個模型。改變一個變量往往需要從頭開始。"
為了克服這個問題,使機器人的訓練和部署變得更加簡單快捷,這個名為 Open-X Embodiment 的新項目引入了兩個關鍵組件:一個包含多種機器人類型數據的數據集,以及一個能夠在各種任務中轉移技能的模型系列。研究人員在機器人實驗室和不同類型的機器人上對這些模型進行了測試,與常用的機器人訓練方法相比,取得了卓越的效果。
結合機器人數據
Open X-Embodiment 項目的誕生源于這樣一種直覺:將來自不同機器人和任務的數據結合起來,可以創建一個優于專用模型的通用模型,適用于所有類型的機器人。這一概念部分受到大型語言模型(LLMs)的啟發,在大型通用數據集上進行訓練后,LLMs 可以與在狹窄的特定任務數據集上訓練的小型模型相媲美,甚至更勝一籌。令人驚訝的是,研究人員發現,同樣的原理也適用于機器人技術。
為了創建 "Open X-Embodiment "數據集,研究團隊收集了來自不同國家 20 個機構的 22 個機器人實例的數據。該數據集包含 100 多萬個事件中的 500 多種技能和 15 萬項任務的示例(一個事件是機器人每次嘗試完成一項任務時的一連串動作)。
RT-2-X 在新技能(即訓練數據集中未包含的新任務)方面的成功率是 RT-2 的三倍。特別是,RT-2-X 在需要空間理解的任務上表現得更好,例如,分辨將蘋果移到布附近與放在布上的區別。
研究人員在一篇發布 Open X 和 RT-X 的博文中寫道:"我們的研究結果表明,與其他平臺的數據共同訓練為 RT-2-X 注入了原始數據集中沒有的額外技能,使其能夠執行新穎的任務。"
邁出機器人研究的未來步伐
展望未來,科學家們正在考慮將這些進展與DeepMind開發的自我完善模型RoboCat的見解相結合的研究方向。RoboCat 可以學習在不同的機械臂上執行各種任務,然后自動生成新的訓練數據,以提高其性能。
桑凱蒂認為,另一個潛在的方向是進一步研究不同的數據集混合物會如何影響跨實驗泛化,以及改進后的泛化是如何實現的。
該團隊已經開源了Open X-Embodiment數據集和RT-1-X模型的一個小版本,但沒有開源RT-2-X模型。他說:
"我們相信,這些工具將改變機器人的訓練方式,并加速這一領域的研究。我們希望數據開源和提供安全但有限的模型能夠減少障礙,加快研究。機器人技術的未來有賴于讓機器人能夠相互學習,最重要的是讓研究人員能夠相互學習。"
2025-02-22 08:53
2025-02-20 09:01
2025-02-20 09:01
2025-02-20 08:58
2025-02-20 08:58
2025-02-20 08:57
2025-02-20 08:56
2025-02-20 08:55
2025-02-19 11:51
2025-02-19 11:50