想讓機器人“聽懂人話”,需要必備哪些技能?【AI大咖說】第八期,走進優必選自然語言處理技術!
“我們把香蕉給猴子,因為它們餓了。”
“我們把香蕉給猴子,因為它們熟透了。”
這兩句話,你讀得懂是什么意思嗎?然而對機器人來說,就沒那么簡單了。如果AI不能清晰了解猴子和香蕉的屬性,就會導致無法區分。正如語音識別幫助機器人“聽”,視覺技術幫助機器人“看”,想要做到機器人“聽懂人話”,就需要自然語言處理(Natural Language Processing,NLP)來解決。一起來看看機器人是如何“善解人意”的:
AI因斯坦·琨帶你走進機器人的NLP運用▲
機器人語音交互技術概述
語音交互是機器人最重要的交互入口之一,機器人對于人類語義的理解尤為關鍵。如下圖所示,人類語音通過ASR(語音識別)把音頻變成文本,文本經過NLU(語義理解)、DM(對話管理)以及NLG(語言生成),語言生成后再通過TTS(語音合成),完成人機對話。
NLP概述與發展
自然語言是人類智慧的結晶,機器人對語義的理解和分析能力、對自然語言的生成能力、對知識的學習能力,是AI最核心且最具挑戰的技術之一。我們先來看一下NLP發展的幾個階段:
· 第一階段:2000年之前,主要基于規則和概率統計的方法,50年代提出圖靈測試概念來判斷機器是否會思考,然而到目前為止,還沒有出現被一致認可的通過圖靈測試的對話系統。
· 第二階段:2013年,神經網絡興起,極大提升NLP的各項能力。
· 第三階段:基于seq2seq模型的NLP和注意力機制,文本生成和機器翻譯方面獲得較大進展。
· 第四階段:2018年以來,大型預訓練模型發展,NLP領域突破捷報頻頻,也就是現在所處的階段。
NLP技術則分為核心應用和基礎技術。它的應用非常廣泛,包括情感、信息、問答、機器翻譯、自動文摘、閱讀理解以及文本分類等。
自然語言處理技術的核心應用
基礎技術包括自動分詞、詞性標注、命名實體識別以及句法分析。
· 自動分詞
中文分詞是自然語言處理領域基礎的模塊,由此前的基于規則和基于概率統計,發展到今天的基于深度學習。比如“武漢市長|江大橋”還是“武漢市|長江大橋”的劃分,就是通過統計模型把詞分配好。
悟空機器人分詞斷句后,理解并執行任務
· 詞性標注
在中文分詞之后,預測每個詞的漢語詞性也是中文自然語言處理的基礎模塊。通常詞性標注的粒度很細,如動詞、副動詞、趨向動詞、不及物動詞等。
詞性分析決定句子用哪一個“de”
· 命名實體識別
識別文本中具有特定意義的實體,包括人名、地名、機構名、專有名詞等,以及時間、數量、貨幣、比例數值等文字。
命名實體識別是一個從句中挑出實體類型的過程
· 句法分析
用于確定句子的語法結構或詞匯之間的依存關系(主謂賓、定狀補等句法關系),包括句法結構分析、依存關系分析。
2025-04-17 19:19
2025-04-17 08:18
2025-04-17 08:18
2025-04-17 08:17
2025-04-17 08:15
2025-04-17 08:14
2025-04-17 08:14
2025-04-16 11:04
2025-04-16 10:58
2025-04-16 10:53