深度學(xué)習(xí)是一種在表達能力上靈活多變,同時又允許計算機不斷嘗試,直到最終逼近目標(biāo)的一種機器學(xué)習(xí)方法。從數(shù)學(xué)本質(zhì)上說,深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)方法并沒有實質(zhì)性差別,都是希望在高維空間中,根據(jù)對象特征,將不同類別的對象區(qū)分開來。但深度學(xué)習(xí)的表達能力,與傳統(tǒng)機器學(xué)習(xí)相比,卻有著天壤之別。
簡單地說,深度學(xué)習(xí)就是把計算機要學(xué)習(xí)的東西看成一大堆數(shù)據(jù),把這些數(shù)據(jù)丟進一個復(fù)雜的、包含多個層級的數(shù)據(jù)處理網(wǎng)絡(luò)(深度神經(jīng)網(wǎng)絡(luò)),然后檢查經(jīng)過這個網(wǎng)絡(luò)處理得到的結(jié)果數(shù)據(jù)是不是符合要求——如果符合,就保留這個網(wǎng)絡(luò)作為目標(biāo)模型,如果不符合,就一次次地、鍥而不舍地調(diào)整網(wǎng)絡(luò)的參數(shù)設(shè)置,直到輸出滿足要求為止。
由圖可以明顯看出DL在從06年崛起之前經(jīng)歷了兩個低谷,這兩個低谷也將神經(jīng)網(wǎng)絡(luò)的發(fā)展分為了三個不同的階段。
我們換一種更直觀的講法
假設(shè)深度學(xué)習(xí)要處理的數(shù)據(jù)是信息的“水流”,而處理數(shù)據(jù)的深度學(xué)習(xí)網(wǎng)絡(luò)是一個由管道和閥門組成的巨大的水管網(wǎng)絡(luò)。網(wǎng)絡(luò)的入口是若干管道開口,網(wǎng)絡(luò)的出口也是若干管道開口。這個水管網(wǎng)絡(luò)有許多層,每一層有許多個可以控制水流流向與流量的調(diào)節(jié)閥。根據(jù)不同任務(wù)的需要,水管網(wǎng)絡(luò)的層數(shù)、每層的調(diào)節(jié)閥數(shù)量可以有不同的變化組合。對復(fù)雜任務(wù)來說,調(diào)節(jié)閥的總數(shù)可以成千上萬甚至更多。水管網(wǎng)絡(luò)中,每一層的每個調(diào)節(jié)閥都通過水管與下一層的所有調(diào)節(jié)閥連接起來,組成一個從前到后,逐層完全連通的水流系統(tǒng)(這里說的是一種比較基本的情況,不同的深度學(xué)習(xí)模型,在水管的安裝和連接方式上,是有差別的)。
那么,計算機該如何使用這個龐大的水管網(wǎng)絡(luò),來學(xué)習(xí)識字呢?
比如,當(dāng)計算機看到一張寫有“田”字的圖片時,就簡單將組成這張圖片的所有數(shù)字(在計算機里,圖片的每個顏色點都是用“0”和“1”組成的數(shù)字來表示的)全都變成信息的水流,從入口灌進水管網(wǎng)絡(luò)。
我們預(yù)先在水管網(wǎng)絡(luò)的每個出口都插一塊字牌,對應(yīng)于每一個我們想讓計算機認識的漢字。這時,因為輸入的是“田”這個漢字,等水流流過整個水管網(wǎng)絡(luò),計算機就會跑到管道出口位置去看一看,是不是標(biāo)記有“田”字的管道出口流出來的水流最多。如果是這樣,就說明這個管道網(wǎng)絡(luò)符合要求。如果不是這樣,我們就給計算機下達命令:調(diào)節(jié)水管網(wǎng)絡(luò)里的每一個流量調(diào)節(jié)閥,讓“田”字出口“流出”的數(shù)字水流最多。
這下,計算機可要忙一陣子了,要調(diào)節(jié)那么多閥門呢!好在計算機計算速度快,暴力計算外加算法優(yōu)化(其實,主要是精妙的數(shù)學(xué)方法了,不過我們這里不講數(shù)學(xué)公式,大家只要想象計算機拼命計算的樣子就可以了),總是可以很快給出一個解決方案,調(diào)好所有閥門,讓出口處的流量符合要求。
下一步,學(xué)習(xí)“申”字時,我們就用類似的方法,把每一張寫有“申”字的圖片變成一大堆數(shù)字組成的水流,灌進水管網(wǎng)絡(luò),看一看,是不是寫有“申”字的那個管道出口流出來的水最多,如果不是,我們還得再次調(diào)整所有的調(diào)節(jié)閥。這一次,要既保證剛才學(xué)過的“田”字不受影響,也要保證新的“申”字可以被正確處理。
如此反復(fù)進行,直到所有漢字對應(yīng)的水流都可以按照期望的方式流過整個水管網(wǎng)絡(luò)。這時,我們就說,這個水管網(wǎng)絡(luò)已經(jīng)是一個訓(xùn)練好的深度學(xué)習(xí)模型了。
瑕疵品檢測
在工業(yè)生產(chǎn)過程中,瑕疵檢測是很多產(chǎn)品質(zhì)量檢測環(huán)節(jié)及其重要的步驟。瑕疵檢測裝置將工業(yè)相機采集到的產(chǎn)品表面圖像經(jīng)過圖像處理軟件進行瑕疵識別處理,找出瑕疵,同時對瑕疵進行有效的分類及后續(xù)處理。傳統(tǒng)的圖像處理軟件存在幾個方面問題:
一、圖像處理軟件開放參數(shù)多,需投入大量精力調(diào)試才能到達較好檢測性能。
二、圖像處理軟件底層算法通用性及功能拓展性弱,對于新產(chǎn)品及其客戶新需求,需要人員來重新開發(fā)。
我司案例
磁片檢測
我司研發(fā)的磁片合格檢測系統(tǒng)通過搭建深度神經(jīng)網(wǎng)絡(luò)對訓(xùn)練圖片中的合格及NG圖進行學(xué)習(xí),并利用學(xué)習(xí)收斂后的模型對新的磁片圖進行分類。
磁片的合格鑒定是一個比較復(fù)雜的視覺檢測任務(wù),這是因為磁片表面的紋理,污漬,水滴及光線導(dǎo)致的陰影都可能對識別產(chǎn)生影響。難以用有限且明確的特征描述磁片的合格與否。利用傳統(tǒng)匹配及輪廓提取等算法很容易導(dǎo)致將大量合格品鑒定為不合格,使得誤檢率極高,而假設(shè)算法放松對合格品的標(biāo)準(zhǔn),則會導(dǎo)致判定的合格品中包含不合格品,引起更為致命的漏檢。
我司在傳統(tǒng)視覺算法的基礎(chǔ)上引入深度學(xué)習(xí)技術(shù),搭建深度神經(jīng)網(wǎng)絡(luò)對大量人工標(biāo)注的圖片進行學(xué)習(xí)訓(xùn)練,自動提取特征并進行不斷的迭代計算直至模型收斂。經(jīng)過驗證,基于深度學(xué)習(xí)的檢測系統(tǒng)可以實現(xiàn)對磁片圖片更為精準(zhǔn)、穩(wěn)定的檢測。
下圖為合格磁片
下圖為NG磁片
注:Ans為真實值
Pr為神經(jīng)網(wǎng)絡(luò)計算結(jié)果
輪轂凸臺檢測
我司研發(fā)的輪轂凸臺定位系統(tǒng)通過搭建深度神經(jīng)網(wǎng)絡(luò)對訓(xùn)練圖片中的輪轂凸臺位置進行學(xué)習(xí),并利用學(xué)習(xí)收斂后的模型對新的輪轂圖進行定位檢測。
如下圖所示,自動化車間的生產(chǎn)環(huán)境很難保證圖片特征一致且良好,因此利用傳統(tǒng)視覺匹配算法抗干擾性較差,會出現(xiàn)模板匹配不上導(dǎo)致的凸臺識別失敗。而利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)對大量圖片特征及標(biāo)注進行自主學(xué)習(xí)和模型迭代,會使檢測系統(tǒng)具有更高的魯棒性和抗干擾能力。我司研發(fā)的深度學(xué)習(xí)系統(tǒng)能夠?qū)μ卣鞑幻黠@或有損壞的凸臺進行精準(zhǔn)定位,如第二張圖所示。
注:圖中黑色圓為神經(jīng)網(wǎng)絡(luò)對新輪轂圖片進行凸臺定位的結(jié)果
2025-04-29 22:24
2025-04-29 22:23
2025-04-29 22:22
2025-04-29 22:22
2025-04-29 22:21
2025-04-29 22:20
2025-04-29 22:19
2025-04-29 22:18
2025-04-29 22:17
2025-04-29 22:16