美國麻省理工學院(MIT)的研究人員將人工智能緩解交通擁堵的理念應用于解決倉庫中的機器人路徑規劃問題。據麻省理工學院稱,該團隊已經開發出一種深度學習模型,它可以比典型的強隨機搜索方法快近四倍的速度為機器人解除擁堵。
在一個典型的自動化倉庫中,可能有數百個移動機器人往返于他們的目的地,并試圖避免相互碰撞。規劃所有這些同時進行的運動是一個難題。該大學的研究人員說,這個問題非常復雜,即使是最好的路徑搜索算法也很難跟上。
通過將難以解決的問題分解成更小的塊,一種深度學習技術可以確定倉庫中疏導交通的最佳區域。
在一個巨大的機器人倉庫里,數百個機器人在地面上來回穿梭,抓取物品并交付給人類工人進行包裝和運輸。這種倉庫正日益成為從電子商務到汽車生產等許多行業供應鏈的一部分。
然而,要讓 800 個機器人高效地往返于目的地,同時又要防止它們相互碰撞,并不是一件容易的事。這是一個非常復雜的問題,即使是最好的路徑搜索算法也很難跟上電子商務或制造業的飛速發展。
從某種意義上說,這些機器人就像試圖在擁擠的市中心穿梭的汽車。因此,一群利用人工智能緩解交通擁堵的麻省理工學院研究人員將該領域的想法應用于解決這一問題。
他們建立了一個深度學習模型,對倉庫的重要信息(包括機器人、計劃路徑、任務和障礙物)進行編碼,并利用這些信息預測倉庫的最佳疏導區域,以提高整體效率。
他們的技術將倉庫中的機器人分成若干組,因此這些較小的機器人組可以用傳統的機器人協調算法更快地解除擁堵。最終,他們的方法比強隨機搜索法的疏導速度快了近四倍。
除了簡化倉庫操作,這種深度學習方法還可用于其他復雜的規劃任務,如計算機芯片設計或大型建筑的管道布線。
"我們設計了一種新的神經網絡架構,它實際上適用于這些倉庫這種規模和復雜程度的實時操作。它可以對數百個機器人的軌跡、出發地、目的地以及與其他機器人的關系進行編碼,而且可以以一種高效的方式實現這一點,在各組機器人之間重復使用計算。"MIT土木與環境工程(CEE)專業吉爾伯特-W-溫斯洛職業發展助理教授、信息與決策系統實驗室(LIDS)和數據、系統與社會研究所(IDSS)成員凱茜-吳(Cathy Wu)說。
吳是該技術論文的資深作者,他與第一作者、電氣工程和計算機科學專業的研究生閆中霞共同完成了這項研究。這項研究成果將在學習表征國際會議(International Conference on Learning Representations)上發表。
機器人俄羅斯方塊
從鳥瞰圖上看,機器人電子商務倉庫的地面有點像快節奏的 "俄羅斯方塊 "游戲。
當客戶下訂單時,機器人會走到倉庫的某個區域,抓起放置所需物品的貨架,然后將其交給人類操作員,由其揀選和包裝物品。數百個機器人同時進行這項工作,如果兩個機器人在穿過巨大的倉庫時路徑發生沖突,它們就可能撞車。
傳統的搜索算法會讓其中一個機器人繼續沿著自己的路線前進,并為另一個機器人重新規劃軌跡,從而避免可能發生的碰撞。但是,由于機器人數量眾多且可能發生碰撞,問題很快就會呈指數級增長。
"由于倉庫是在線運行的,機器人大約每 100 毫秒就要重新規劃一次。也就是說,每秒鐘,一個機器人就要重新掃描 10 次。因此,這些操作必須非常快速。"吳說。
由于在重新規劃過程中時間非常關鍵,麻省理工學院的研究人員利用機器學習將重新規劃的重點放在最容易發生擁堵的地方,也就是最有可能縮短機器人總行程時間的地方。
Wu 和 Yan 建立了一個神經網絡架構,可以同時考慮較小的機器人群組。例如,在一個擁有 800 個機器人的倉庫中,網絡可能會將倉庫地面切割成更小的組,每組包含 40 個機器人。
然后,如果使用基于搜索的求解器來協調該組機器人的軌跡,它就能預測出哪一組最有可能改進整體解決方案。
整個算法是一個迭代過程,先用神經網絡選出最有潛力的機器人組,再用搜索求解器解散該組,然后用神經網絡選出下一個最有潛力的組,依此類推。
考慮關系
神經網絡能有效推理機器人群,因為它能捕捉到單個機器人之間存在的復雜關系。例如,即使一個機器人最初可能離另一個機器人很遠,但它們的路徑仍可能在行進過程中交叉。
該技術還能簡化計算,只需對約束條件進行一次編碼,而無需對每個子問題重復編碼。例如,在一個擁有 800 個機器人的倉庫中,要疏導一組 40 個機器人,就需要將其他 760 個機器人作為約束條件。其他方法則需要在每次迭代中對每組所有 800 個機器人推理一次。
而研究人員的方法只需要在每次迭代中對所有組中的 800 個機器人進行一次推理。
"倉庫是一個大的環境,因此這些機器人組中有很多都會有一些共同的大問題。我們設計的架構就是為了利用這些共同的信息。"她補充道。
他們在幾個模擬環境中測試了他們的技術,包括一些像倉庫一樣的環境,一些帶有隨機障礙物的環境,甚至還有模擬建筑物內部的迷宮設置。
通過識別更有效的疏導群組,他們基于學習的方法疏導倉庫的速度比強大的、非基于學習的方法快四倍。即使考慮到運行神經網絡的額外計算開銷,他們的方法解決問題的速度仍然快 3.5 倍。
未來,研究人員希望從他們的神經模型中獲得簡單的、基于規則的見解,因為神經網絡的決定可能是不透明的,難以解釋。更簡單、基于規則的方法也更容易在實際機器人倉庫環境中實施和維護。
"這種方法基于一種新穎的架構,在這種架構中,卷積和注意力機制能夠有效地互動。令人印象深刻的是,它能夠考慮到所構建路徑的時空成分,而無需針對具體問題進行特征工程。結果非常出色:康奈爾理工學院安德魯-H.和安-R.-蒂施教授 Andrea Lodi 說:"我們不僅能在求解質量和速度方面改進最先進的大型鄰域搜索方法,而且該模型還能很好地推廣到未見過的案例中。"
這項工作得到了亞馬遜和麻省理工學院亞馬遜科學中心的支持。
2025-04-29 22:21
2025-04-29 22:19
2025-04-28 12:37
2025-04-28 12:24
2025-04-24 15:08
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16