科幻小說中平行宇宙多是由與人類難以區分的機器人組成的。這些機器人通常比我們更聰明、更敏捷、更強壯。他們似乎有能力做任何可以想象到的工作,從駕駛星際飛船、對抗外星人入侵,到清理垃圾以及烹飪美食。
當然,現實遠非幻想。除了工業環境之外,機器人仍未達到《杰森一家》中機器人的程度。公眾所接觸到的機器人似乎不過是一些尺寸過大的塑料玩具,它們被事先設定好執行一系列任務的程序,卻沒有能力與周圍的環境或他們的創造者進行有意義的互動。
套用PayPal聯合創始人、科技企業家PeterThiel的話來說就是“我們本想要酷酷的機器人,但我們只得到了有著140字輸入限制的漢堡機器人Flippy”。但是,科學家們正在逐步取得進展,賦予機器人與人類一樣的能力,可以對周圍的環境進行觀察并作出反應。
本月該領域取得了一些最新進展,在年度機器人大會暨馬薩諸塞州劍橋科學與系統會議上所提出來了關于機器人的新議題,深入探討了一些話題,包括如何讓機器人更健談,如何幫助機器人理解語言的模糊性,以及幫助機器人在復雜的空間中觀察和導航等。
優化的視覺
杜克大學的研究生BenBurchfiel以及他的導師GeorgeKonidaris、布朗大學計算機科學助理教授,提出了一種新算法,可以讓機器能夠從更像人類的視角來看待這個世界。
在論文中,Burchfiel和Konidaris展示了他們如何能教會機器人識別物體并盡可能操縱三維物體——即使物品可能被遮住或放置在陌生的位置上,比如被打翻的茶壺。
研究人員對機器人的算法進行了訓練,方式是對大約4,000種常見的家用物品進行3D掃描,如床鋪、椅子、桌子、馬桶等。然后,他們測試了機器人以鳥類視角的視覺能力和分辨出900個新的3D物體的觀察能力。相對于其他計算機視覺技術只有50%的正確率而言,該算法的準確率高達75%。
研究人員表示,他們并不是第一批研究并訓練機器對3D物體進行分類的。但和其他的研究不同的是,他們對機器人學習物體分類的空間進行了限制。
“想象一下所有可能的物體存在的空間,”研究人員解釋道:“這就是說,假如你有微型樂高積木,我告訴你,你可以隨意將它們粘在一起來創造不同的東西。你可以創造出很多東西!”
這種無限的可能性最終可能會給人類或機器創造出識別不了的物體。
為了解決這個問題,研究人員讓他們的算法找到了一個更有限的空間,以容納它將要辨認的物體。通過在這個有限空間中工作——從數學上說,我們稱之為子空間——極大地簡化了分類任務。正因為發現了這個空間才讓研究人員擁有了區別于以往的方法。
服從命令
與此同時,布朗大學的兩名本科生找到了一種方法,可以讓機器人更好地理解方向概念,甚至在不同程度的抽象概念上也可以完成。
由DilipArumugam和SiddharthKaramcheti帶領的這項研究探討了如何訓練機器人理解自然語言的細微差別,以及隨后如何正確有效地遵循指令。
“問題在于,命令可以有不同的抽象級別,這可能會導致機器人無法有效地規劃其行為或根本無法完成任務。”Arumugam說。
在這個項目中,研究人員提供了將虛擬機器人移動到在線域名的說明。該空間包括幾個房間和一把椅子,機器人被告知要從一個地方到另一個地方操縱。志愿者向機器人發出各種指令,這些指令既有較為概括的,比如“把椅子帶到藍色房間”,也有一步一步的具體指令。
然后,研究人員使用指令數據庫來教系統理解不同的表達方式。這臺機器不僅學會了遵循指令,還學會了識別不同抽象程度的話語。這是解決問題的能力,以最合適的方式解決這個問題的關鍵。
研究最終從虛擬環境進入了真實世界,使用了一個和Roomba相似的機器人,90%的情況下,該機器人可以做到一秒內對指令作出反應。相反,當無法識別任務的特異性時,機器人需要20秒或更長的時間來完成或計劃。
論文中提到的這種新機器學習技術的一個應用是在倉庫環境中工作的機器工人,但還有許多領域可以從更全能的機器中受益,這種機器能夠在具體操作和一般化任務之間無縫切換。
“其他可能受益于這樣系統的領域包括自動駕駛汽車、輔助機器人技術以及醫療機器人等。”SingularityHub在回答一封郵件來信時這樣說。
還有更多值得期待
這些研究成果有助于幫助人們實現創造出可以像人類那樣看、聽和行動的類人機器人的理想。不過,這距離真正創造出類人機器人還有很長的路要走。
“我們目前所采取的學習模式還不能達到這一點,前面有很多障礙:從看似簡單的問題,比如如何處理從未見過的單詞,如何處理更困難、更復雜的問題,如何解決語言中固有的含糊性,例如習語或比喻表達等。”
即使相對“話多”的聊天機器人也可能會被問的無言以對,因為未來人機談話可能變得更加復雜。根據Burchfiel的說法,人類的視力也是如此。
雖然深度學習技術極大地改善了模式匹配——谷歌能找到任何一張貓的照片——但人類的視力具有的能力遠不止于找東西。
“有兩大領域我認為人工智能的認知還有很長的路要走:歸納性偏見和形式推理,”Burchfiel說。他解釋道,前者本質上是人們用來幫助他們推理的背景知識。他使用大街上的一個水坑作為例子。例如,人們習慣于認為這是一灘水,而不是一塊玻璃。他說:“這種偏見可以解釋為什么當人們看著云的時候我們會認為看到了人臉,因為我們對于人臉有很強的偏好。”雖然乍一聽起來很簡單,但它卻為我們所做的大部分事情提供了動力。人類對自己期望看到的東西有一種非常直觀的理解,這讓認知變得更容易。
形式推理同樣重要。在Burchfiel的例子中,當一臺機器學習了水向下流的原理后,它可以利用深度學習算法計算出所有河流的流向。但它還沒有擁有人類將此知識擴展到其他事物上的能力,例如研究水在火星的管道系統里是如何運動的。
“在過去的幾十年里,我們做了很多這樣的形式推理……但我們還沒有找到如何將它與標準的機器學習方法結合起來以創造出一個在現實世界中有益的無縫化系統。”Burchfiel表示。機器人在人類身上還有很多東西需要學習,這應該會讓我們感覺良好,因為這證明人類才是地球上最復雜的。
2025-02-26 08:53
2025-02-25 10:56
2025-02-25 10:46
2025-02-25 10:29
2025-02-24 22:23
2025-02-24 22:22
2025-02-24 10:31
2025-02-24 10:11
2025-02-24 09:33
2025-02-24 09:28