2025年7月14日,日本豐田研究院(Toyota Research Institute,簡稱TRI)發(fā)布了其在機器人學習領(lǐng)域的重要突破——基于“Diffusion Transformer”架構(gòu)的大型行為模型(Large Behavior Model,LB+M)。該團隊研究表明,通過單一通用行為模型,機器人在執(zhí)行數(shù)百種操控任務(wù)時可實現(xiàn)訓(xùn)練數(shù)據(jù)需求降低達80%,為通用智能機器人的發(fā)展提供現(xiàn)實路徑振奮人心的驗證。
TRI成立于2016年,總部設(shè)立于日本加州的高級研究中心,致力于將AI技術(shù)在機器人、交通和人機交互領(lǐng)域?qū)崿F(xiàn)落地。此次發(fā)布的LBM模型,引領(lǐng)機器人從傳統(tǒng)“任務(wù)單一”向“多任務(wù)泛化”演進的關(guān)鍵一步,是其通向“通用助手”或“泛用工廠”戰(zhàn)略的重要里程碑。
TRI團隊通過掃描近1700小時涵蓋仿真與現(xiàn)實世界的機器人操作數(shù)據(jù),訓(xùn)練出一個含29類任務(wù)的預(yù)訓(xùn)練模型,包括抓取、組合裝配、扭轉(zhuǎn)擰緊等復(fù)雜動作。值得關(guān)注的是,該模型僅用原來20%的訓(xùn)練樣本便達成相似或更優(yōu)表現(xiàn)——機器人能在陌生任務(wù)與環(huán)境下實現(xiàn)快速遷移式學習,表現(xiàn)出超越傳統(tǒng)Policy網(wǎng)絡(luò)的適應(yīng)能力與魯棒性。
TRI采用的“Diffusion Transformer”架構(gòu),支持將視覺、語言、力覺與姿態(tài)等多模態(tài)感知輸入,轉(zhuǎn)化為連續(xù)運動控制輸出,流程執(zhí)行符合實時要求,并在標準A/B盲測中獲高置信度評價。研究團隊還開發(fā)出一套統(tǒng)計評估系統(tǒng),確保模型表現(xiàn)可靠且可復(fù)制。
TRI機器人研究副總裁Russ Tedrake指出:“LBM使我們朝‘訓(xùn)練一次,部署多處’的機器人學習范式邁進,這是建立通用機器人能力的方向。”后續(xù)的系統(tǒng)改進,包括引入更多預(yù)訓(xùn)練任務(wù)、強化自我糾錯與在線更新機制,均將在未來迭代中逐步展開。
這項技術(shù)潛在應(yīng)用于制造、物流甚至家庭服務(wù)等多領(lǐng)域。TRI稱其為“universal factories”范式:一套模塊化、靈活可編排的機器人模型,能應(yīng)對大規(guī)模混合生產(chǎn)、小批量定制或復(fù)雜裝配任務(wù),使得“敏捷制造”成為可能。
LBM與傳統(tǒng)DQ/DDP或RL方法相比具備以下優(yōu)勢:其一,依賴通用預(yù)訓(xùn)練與少量微調(diào)即可適用新任務(wù),增加模型泛化度;其二,減少訓(xùn)練所需采樣、實驗量和計算資源,將機器人部署成本大幅壓縮;其三,使機器人具備“從經(jīng)驗學習”的能力,不再完全依賴人類教學或腳本硬編碼。
目前,LBM仍處于初期階段,TRI正與學界和工業(yè)界密切合作,比如與美國Boston Dynamics聯(lián)合研究,將LBM部署于Atlas類人機器人,驗證其在走路、搬運等復(fù)雜全身協(xié)調(diào)任務(wù)中的實用性與效率。
機器人操作行業(yè)專家評價認為,LBM的發(fā)布代表機器人向“行為基礎(chǔ)模型”方向重構(gòu)的開端。相比模型專注單工種、難以擴展的歷史,LBM支持機器人進行一體化智能培訓(xùn),類似于LLM賦能語言應(yīng)用的范式,將為機器人快速落地帶來啟發(fā)。
值得注意的挑戰(zhàn)包括:一是如何獲取高質(zhì)量、多物體、多模態(tài)訓(xùn)練數(shù)據(jù);二是保證模型在現(xiàn)實世界執(zhí)行的可控性與安全性;三是路徑采樣與決策速度需進一步與現(xiàn)場工業(yè)節(jié)拍匹配。
但從根本來看,Toyota研發(fā)的LBM為機器人行業(yè)提供了新的智能基石。在全球機器人成本與效率成為競爭關(guān)鍵的背景下,LBM模式可能開創(chuàng)新一代通用機器人生態(tài),為制造、物流、服務(wù)乃至農(nóng)業(yè)環(huán)境帶來全方位變革。
TRI的這一突破不僅是機器人技術(shù)層面創(chuàng)新,更為全球產(chǎn)業(yè)智能化提供可復(fù)制路徑。接下來若Farmbot、Fetch Robotics等行業(yè)方案商能與TRI此類模型融合,將帶來前所未有的研發(fā)效率與商業(yè)應(yīng)用速度,“訓(xùn)練—部署—協(xié)同”將成為機器人推廣的新框架。
2025-07-25 12:20
2025-07-25 12:19
2025-07-25 12:19
2025-07-25 12:18
2025-07-25 12:17
2025-07-25 12:17
2025-07-25 12:14
2025-07-25 12:14
2025-07-25 12:13
2025-07-25 09:41