而AI的算法像深度學習,通過統計和大數據迎來一個非常大的飛躍,它在圖像識別還有語音識別上已經超越了人類的能力。而且我們看到更大的數據也成為了可能,例如一輛無人駕駛汽車一天就產生4TB的數據,而且是不同源的、異構的數據。有了這些數據以后就要考慮怎樣去處理它來產生實時的價值,提供可靠、高質量的服務。
現在深度學習一枝獨秀,但是處理這么多種數據完成目標任務只靠這一類算法是不夠的。所以,NN+X就代表要讓神經網絡加各種新的技術,并且要正視人工智能算法的局限性。引用一下機器人界也是人工智能學界的大牛Rodney Brooks教授(人工智能專家,行為學派杰出代表,美國國家工程院院士,iRobot、Rethink Robotics創始人,Baxter之父,MIT CSAIL前主任)的觀點,他主張先不去管用什么樣的邏輯模型或者什么樣的神經網絡模型去模擬人的思維過程,而要通過實際的智能體去感知,然后去研究怎樣通過全系統優化去做出正確的反應。他認為特別是產業界不要沉迷于某一種技術,重要的是根據實際需要去使用技術,為人類提供價值。他認為第一輪AI可以提供的價值是在五年左右,在輔助駕駛和自動駕駛這個領域,第二輪就是十年左右,可以在助老機器人領域提供很大的社會價值。
關于在機器中加入智能能力,整個產業界是在分三步走。首先是把一些不聯網的設備連了網,連網以后設備就有了信息傳遞和更新的能力,同時它也可以結合社交服務提供客戶價值。但這個還不算多么智能,只算把設備互聯了。第二步就是我們現在所處的智能設備這個級別,其實就是手機上能夠提供的這些智能服務,把視覺、聽覺識別的能力加進去,再結合數據挖掘技術和知識庫提供服務。這些智能機器能夠聽和看,但還不是聽懂和看懂。終極目標是第三步,就是自主機器。現在我們基本上已經跨越了第二步,正在向第三步邁進。但這個發展過程不是線性的,因為從第二步到第三步會越來越復雜,不僅要理解環境和行為,還要能理解人的情緒。因為機器人服務的是人,如果不能理解人的情緒、達到交流共識的話,就沒法提供很好的服務。
智能機器人就是典型的自主系統。如上圖所示,從現在的計算機技術(CT: Computer Technology)到未來的機器人技術(RT: Robot Technology),需要人工智能技術與其它技術緊密合作完成“感知-認知-執行”的人機交互閉環。機器人工作在一個開放的環境里,服務的是不愿遵守刻板交互規則的普通消費者。從整個交互過程來講有很多不確定性,沒有AI算法能夠保證不出問題,因此必須結合其它技術來滿足消費者對智能機器人的預期。我認為智能交互(SI)是最佳選擇,因為它可以充分通過機器人的移動性和主動交互能力來利用人這個通用智能體去補足人工智能。
舉兩個例子來說明智能交互的威力。我們知道在視覺識別物體的時候,角度和遮擋都會影響識別效果。對于機器人來講,它可以利用移動性主動選擇一個好的角度、避開遮擋來準確識別物體。再進一步,在場景理解的時候,對于能夠準確分割的物體,如果不能確信是什么的話(例如凳子還是茶幾),機器人可以主動組織一個問句來詢問人。由此我們可以看出,靈活利用機器人的主動移動和交互能力可以顯著提升整體服務能力,促進智能機器人的產業化。
簡而言之,我認為在智能機器人的商業化迭代方面,首先要保證服務能力達標,然后在這個能力要求下選擇合適的人工智能算法,配合靈活的智能交互的方案一起去達成這個能力。隨著算法能力和硬件技術的提高,在保持服務能力的前提下,逐步擴大AI的比重,是通過商業化發展推動AI技術發展的正循環之路。
2024-08-30 02:45
2024-04-15 09:16
2024-04-09 08:56
2024-04-07 08:07
2024-03-11 11:00
2023-08-17 09:41
2023-08-14 09:40
2021-12-22 11:57
2021-07-30 08:50
2021-07-27 08:53