您的位置：首頁 > 資訊 > 行業資訊 > 正文

【前沿】讓機器人學會問問題，或許能加快機器學習進度

2019-10-28 09:17 性質：轉載作者：中國機器人網來源：中國機器人網

免責聲明：AGV網（www.xmydyc.com)尊重合法版權，反對侵權盜版。（凡是我網所轉載之文章，文中所有文字內容和圖片視頻之知識產權均系原作者和機構所有。文章內容觀點，與本網無關。如有需要刪除，敬請來電商榷！）

近年來，研究人員一直在嘗試開能發使機器人學習新技能的方法。一種選擇是讓機器人從人類那里學習這些新技能，在不確定如何操作時從人類用戶的反應中學習。斯坦福大學的研究團隊最近開發了另一種用...

近年來，研究人員一直在嘗試開能發使機器人學習新技能的方法。一種選擇是讓機器人從人類那里學習這些新技能，在不確定如何操作時從人類用戶的反應中學習。

斯坦福大學的研究團隊最近開發了另一種用戶友好的主動獎勵學習方法，可通過讓人類用戶回答他們的問題來訓練機器人。在arXiv上預發表的一篇論文中提出的這種新方法可以訓練機器人主動提出一些問題，這些問題對于人類用戶來說很容易回答，并且不是多余或不必要的，但對于機器人來說這使得他們學習。

研究人員通過電子郵件告訴記者：“我們的團隊對機器人如何學習人類想要的東西很感興趣。” “一種直觀的學習方式是通過提問。例如，您寧愿謹慎駕駛還是主動駕駛自動駕駛汽車？這種自動駕駛汽車應該在人類駕駛的汽車之前還是之后合并？”這項最新研究背后的主要假設是，理想情況下，機器人應該問一些有益的問題，以從人類用戶那里獲取盡可能多的信息。換句話說，高學習能力的機器人應該能夠通過問盡可能少的問題，來理解人類的需求或想要他們做什么。

但是，實際上，大多數基于問題回答的現有培訓方法，都沒有考慮人類用戶回答機器人提出的特定問題有多么容易。這通常會導致用戶浪費時間來回答大量不必要的問題或無法確定地進行響應。

研究人員說：“我們發現大多數最先進的算法都顯示出（幾乎）無法區分的人類替代方案，從而使人們無法正確回答機器人的問題。” “以我們的示例為例，這些方法可能會問：“您是否希望以29 mph或31 mph的速度在人工駕駛汽車前合并？”這對于機器人決定是否在人們希望時速超過30英里/小時，但這種選擇（對于人來說）太接近了，人們無法可靠地做出響應。”

為了克服現有主動學習方法的局限性，研究人員開發了一種算法，可以選擇更有效的問題來詢問用戶。該算法確定的問題最大程度地減少了機器人對人類用戶偏好的不確定性（即，使信息獲取最大化），同時還考慮了人類用戶回答這些問題的難易程度。

研究人員說：“受先前工作的缺點的啟發，當我們開發這種算法時，我們專注于考慮人類實際回答機器人提出的問題的能力。” “這是基于這樣的思想，即只有負責人類回答能力的機器人才能準確，高效地學習人類的需求。”

研究人員通過測量熵的減少（即不確定性的量度）來計算信息增益，該熵的減少是根據機器人提出的問題對人類用戶的偏好進行的。換句話說，最大化信息增益的問題將最大程度地減少機器人對人類用戶的喜好有什么不確定性。這為機器人提供了一個正式的目標，他們可以用來選擇最有用的問題。

“信息增益的一個很好的特點是它固有地最大化了機器人的不確定性（這樣機器人就可以從這個問題中學到很多東西），同時也使人類的不確定性最小化（這樣，這個問題對人類來說是容易回答的）。使用信息增益生成問題，從而提高主動學習，不僅是因為問題是最大的信息，但也因為人類提供更少的錯誤反應。

研究人員設計的方法貪婪地選擇在每一個時間步長最大化信息增益的問題。從本質上講，機器人對與之交互的用戶的偏好保持一種信念（即概率分布），并從這種信念和可能的問題空間中獲取樣本。

最終，機器人選擇的問題是，在當前可能的人類偏好分布中，提供最多的信息增益。隨后，它會根據收到的答案更新用戶想要什么的答案。這個過程不斷重復，讓機器人通過學習用戶的偏好逐漸提高性能。

圖片來源：B?y?k等

研究人員說：“我們制定了一種計算簡便的方法，可以讓我們快速發現人類對真實機器人任務的偏好，優于以往的方法。”在我們的研究中，用戶更喜歡我們的方法，而不是其他最先進的技術。”

在他們的研究中，斯坦福大學的團隊表明，訓練機器人提問最大化信息增益與最先進的方法具有相同的計算復雜性。換句話說，與其他方法產生的問題相比，機器人發現這些信息性問題并不難。

最終，機器人選擇了在可能的人類偏好的當前分布范圍內提供最大信息收益的問題。隨后，它根據收到的答案更新對用戶想要的信念。該過程不斷重復進行，從而使機器人可以通過了解用戶的偏好來逐漸提高其性能。

研究人員說：“我們還指出，我們的方法具有一些理想的數學特性，例如亞模量，這使我們能夠采用為先前方法開發的擴展和理論界限，并將其與我們的方法一起使用。” “例如，我們可以使用先前的著作來一次查找多個信息性問題，而不是一次搜索一個問題。”

該團隊通過一系列模擬評估了他們的主動獎勵學習方法，發現該方法使機器人能夠比其他最新方法更快，更準確地掌握人類的喜好。在人們可以正確回答難題或回答為“我不知道”的情況下，也是如此。

研究人員還進行了一項用戶研究，其中要求人類參與者回答由他們的方法產生的問題，以及使用其他最新方法產生的其他問題。他們收集的反饋表明，人們發現用他們的方法所產生的問題要容易回答得多。另外，用戶通常認為使用新方法的機器人比以前提出的方法更能準確地表達自己的偏好。

研究人員說：“綜合考慮我們所有的貢獻，我們朝著使機器人能夠確定人的偏好邁出了一步。” “我們證明了我們最初希望機器人最大化的真正目標——提出問題以獲取盡可能多的信息，這可以用與現有方法相同的計算復雜性來解決。”

將來，由這組研究人員開發的主動獎勵學習技術可以幫助更有效地訓練機器人，使它們更符合用戶的喜好。此外，它還可用于教機器人問人類可以輕松理解和回答的問題。在未來的研究中，研究人員還希望研究訓練機器人的方法，以對其動作進行有用的解釋。

研究人員說：“我們對機器人感到興奮，它們不僅能提出好問題，還能解釋為什么會提出這些問題。”我們設想這樣一個場景：一輛自動駕駛汽車將人類兩種不同的合并方案可視化，然后說明它之所以詢問這些方案，是因為現在正是交通高峰時間，它想確定自己的行為是否應該更積極。”

0贊 0踩

下一篇 CeMAT ASIA 2019完美收官！

上一篇豐田推出新型機器人技術，可執行85%的人類級任務

網友評論
文明上網，理性發言，拒絕廣告
0條評論

相關資訊
更多>>

中國AGV網本周熱點回顧（2025年5月19日-5月24日)

AGV網(www.xmydyc.com)是中國自動導航機器人(AGV)和自主移動機器人(AMR)行業網站!團隊擁有超過23年的行業垂直門戶運營經驗，多年來見證了傳統內部物料搬運從粗放化、低效率沿著更加智能化、...

2025-05-26 18:37
中國自動化碼頭效率再次刷新世界紀錄

5月22日，歷時10小時35分鐘，隨著“凱普圣拉薩羅”輪最后一個集裝箱完成裝卸作業，山東港口青島港自動化碼頭以橋吊平均單機作業效率62.62自然箱/小時的優異成績，第十三次刷新全球自動化集裝箱碼頭...

2025-05-26 18:35
數智工廠×智慧物流：LET 2025物流展今日正式開幕

中國AGV網（www.xmydyc.com/）新聞中心2025年5月21日，備受業界矚目的中國（廣州）國際物流裝備與技術展覽會（LET 2025）在廣州·中國進出口商品交易會展館D區盛大啟幕！作為華南地區規模最大、...

2025-05-22 13:30
國內單一碼頭最大IGV車隊集結！

近日由上海振華重工集團設計制造的廣州南沙四期全自動化碼頭第四批20臺無人駕駛智能導引車（IGV）全部抵港至此廣州南沙四期全自動化碼頭IGV車隊擴員至158臺標志著國內單一碼頭最大的IGV車隊系統全...

2025-05-19 17:48
京東物流×人大，智慧快遞服務中心落地！

京東物流無人車載著包裹在校園內自動運行，室內配送機器人將快遞“配送到門”，快遞服務中心兼具衣物清洗、二手回收等功能……高校師生收發快遞有了新體驗。5月17日，伴隨中國人民大學第三屆校友日...

2025-05-19 17:46
中國AGV網本周熱點回顧（2025年5月12日-5月17日)

AGV網(www.xmydyc.com)是中國自動導航機器人(AGV)和自主移動機器人(AMR)行業網站!團隊擁有超過23年的行業垂直門戶運營經驗，多年來見證了傳統內部物料搬運從粗放化、低效率沿著更加智能化、...

2025-05-19 17:43
2025長沙國際工程機械展開幕工業車輛企業智能化與綠色化成果亮相

2025年5月15日，第四屆長沙國際工程機械展覽會（2025 CICEE）在長沙國際會展中心正式拉開帷幕。本屆展會以“高端化、智能化、綠色化”為主題，吸引了全球1500余家工程機械企業參展。工業車輛領域...

2025-05-15 18:47
雄安百信：機器人上崗，生產效率提升2倍多

機器人上崗，生產效率提升2倍多4月24日，在雄安百信信息科技有限公司智能制造車間內，工作人員正在啟動AGV智能搬運機器人。記者李暢攝當機器人走進生產車間，生產效率會發生怎樣的改變？在雄安百...

2025-05-08 22:27
北京市紅十字血液中心全國首個智慧血液包裝分揀轉運系統調試運行

近日，北京市紅十字血液中心成分科迎來一場里程碑式的升級——全國首個智慧血液包裝分揀轉運系統的自動化設備進入調試磨合階段。這場技術迭代不僅是對傳統工作模式的顛覆，更是掀起從“人工控制”...

2025-05-08 22:21
4名“新員工”上崗！本事了得！

叮咚，您的貨物已送達！無人駕駛、走位絲滑近日中國鐵路烏魯木齊局集團有限公司烏魯木齊西車輛段迎來了一批“新員工”——4臺AGV智能小車成為職工們的專屬“快遞員”我是今年剛入路的“新員工”。...

2025-05-06 14:45