· 開(kāi)放式閑聊
閑聊分為匹配式閑聊與生成式閑聊。匹配式閑聊具有Q&A庫(kù),Q&A庫(kù)如果足夠大,能達(dá)到較好的閑聊效果;生成式閑聊不需要匹配,將根據(jù)問(wèn)題生成答案。
兩項(xiàng)閑聊技術(shù)各有優(yōu)缺點(diǎn),匹配式閑聊是可控的,通過(guò)語(yǔ)料編撰、增加、刪除等方式,可以在語(yǔ)料庫(kù)建立時(shí)把敏感詞刪除。生成式閑聊的對(duì)話有一定的不可控性,比如語(yǔ)料不干凈,就會(huì)生成不太健康的內(nèi)容,同時(shí)還會(huì)存在語(yǔ)義、語(yǔ)法等問(wèn)題。
閑聊技術(shù)流程圖
閑聊技術(shù)可以說(shuō)是NLP永恒的難題,算法求的是概率,往往缺乏現(xiàn)實(shí)的邏輯推理,而機(jī)器不知冷暖,單憑文字無(wú)法捕獲豐富的情感,這時(shí)候就需要借助視覺(jué)、語(yǔ)音識(shí)別、聲紋信息等技術(shù)進(jìn)行判斷。
· 文本生成
優(yōu)必選科技的NLP算法不止賦予機(jī)器人與人對(duì)話的能力,還賦予機(jī)器人的寫(xiě)作能力,吟詩(shī)作賦、舞文弄墨不在話下。看看輸入“我是只小豬歡樂(lè)多”,生成的古詩(shī)結(jié)果竟然還押韻,這是怎么做到的?
通過(guò)采用GPT模型,首先定義格式(五言絕句、七言絕句、詞牌等),用分隔符分開(kāi),把帶上標(biāo)點(diǎn)符號(hào)的詩(shī)詞給到模型,通過(guò)語(yǔ)言模型訓(xùn)練后,就具備生成能力。生成后進(jìn)行預(yù)處理,并定義詩(shī)詞的類(lèi)型,把詩(shī)詞的內(nèi)容拼接起來(lái),把文本向量化輸入到GPT里,一個(gè)字、一個(gè)字地生成答案。
2025-04-17 19:19
2025-04-17 08:18
2025-04-17 08:18
2025-04-17 08:17
2025-04-17 08:15
2025-04-17 08:14
2025-04-17 08:14
2025-04-16 11:04
2025-04-16 10:58
2025-04-16 10:53