隨著以深度學(xué)習(xí)為代表的人工智能技術(shù)的成熟,國(guó)內(nèi)眾多行業(yè)都在基于人工智能技術(shù)推進(jìn)行業(yè)變革與創(chuàng)新,積極探尋有效、有價(jià)值的應(yīng)用場(chǎng)景進(jìn)行商業(yè)化落地,其中尤以安防行業(yè)表現(xiàn)最為活躍。如災(zāi)害監(jiān)控、人流量監(jiān)控、施工安全監(jiān)控、吸煙檢測(cè)、口罩檢測(cè)等。
雖然深度學(xué)習(xí)發(fā)展取得了不錯(cuò)的成績(jī),但是在產(chǎn)業(yè)落地時(shí)仍然面臨諸多問(wèn)題:訓(xùn)練數(shù)據(jù)獲取難、模型泛化能力差、性能或效率達(dá)不到生產(chǎn)要求等。為此,百度飛槳結(jié)合實(shí)際經(jīng)驗(yàn),選取了火災(zāi)煙霧檢測(cè)、人流量統(tǒng)計(jì)、安全帽檢測(cè)這3個(gè)經(jīng)典的場(chǎng)景,提供了從數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練優(yōu)化,到模型部署的全流程可復(fù)用方案,降低產(chǎn)業(yè)落地門檻。
接下來(lái)我們就一起看下這三個(gè)案例吧:
火災(zāi)煙霧檢測(cè)
2020年,全國(guó)共接報(bào)火災(zāi)25.2萬(wàn)起,死亡1183人,受傷775人,直接財(cái)產(chǎn)損失40.09億元。傳統(tǒng)的火災(zāi)煙霧檢測(cè)存在監(jiān)管難度大、人員管理難、工地?cái)?shù)量多且分散等問(wèn)題。針對(duì)以上問(wèn)題,我們與普宙科技針對(duì)城市和森林兩大場(chǎng)景,基于開(kāi)源數(shù)據(jù)集和自研數(shù)據(jù)集進(jìn)行煙霧和火災(zāi)檢測(cè)的合作研發(fā)。
為了讓模型結(jié)果更具說(shuō)服力,我們重新定義了評(píng)價(jià)指標(biāo):
1)圖片級(jí)別的召回率:只要在有目標(biāo)的圖片上檢測(cè)出目標(biāo)(不論框的個(gè)數(shù)),該圖片被認(rèn)為召回。批量有目標(biāo)圖片中被召回圖片所占的比例,即為圖片級(jí)別的召回率。2)圖片級(jí)別的誤檢率:只要在無(wú)目標(biāo)的圖片上檢測(cè)出目標(biāo)(不論框的個(gè)數(shù)),該圖片被認(rèn)為誤檢。批量無(wú)目標(biāo)圖片中被誤檢圖片所占的比例,即為圖片級(jí)別的錯(cuò)誤率。
本案例分別選用了單階段檢測(cè)模型YOLOV3、PPYOLOV1、PPYOLOV2進(jìn)行實(shí)驗(yàn)。模型優(yōu)化策略包括數(shù)據(jù)增強(qiáng)、可變形卷積、加入背景圖片等,下表詳細(xì)展示了不同實(shí)驗(yàn)結(jié)果(單卡NVIDIA Tesla V100下同):
注:
aug:RandomHorizontalFlip + RandomDistort + RandomCrop + RandomExpand+MixupImage
aug1:RandomResizeByShort + RandomHorizontalFlip
根據(jù)上述實(shí)驗(yàn)數(shù)據(jù),我們的方案降低了錯(cuò)誤率、提高了召回率。推薦使用backbone為ResNet101的PPYOLOV2模型,通過(guò)使用數(shù)據(jù)增強(qiáng)、加入背景圖、COCO預(yù)訓(xùn)練、空間金字塔池化(SPP)等優(yōu)化策略,實(shí)現(xiàn)96%召回率,2.2%的誤檢率。更多優(yōu)化策略詳解請(qǐng)關(guān)注我們的直播課。
將我們AI模型裝入無(wú)人機(jī),可以實(shí)現(xiàn)無(wú)人機(jī)森林智能巡檢,及時(shí)發(fā)現(xiàn)火情。此外,借力AI也可以發(fā)現(xiàn)非法越境、販毒等違法犯罪行為,便于及時(shí)取證調(diào)查。
人流量統(tǒng)計(jì)
在商場(chǎng)或火車站等人流量較大的公開(kāi)場(chǎng)合,其管理者可能需要進(jìn)行動(dòng)態(tài)人流量統(tǒng)計(jì)來(lái)監(jiān)控商場(chǎng)/火車站每天的客流量數(shù)。因?yàn)槿藛T基數(shù)較大、流動(dòng)性較高,通過(guò)人工來(lái)進(jìn)行流量統(tǒng)計(jì)并不現(xiàn)實(shí)。針對(duì)該問(wèn)題,本項(xiàng)目與上海音智達(dá)公司合作,智能高效地實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景下的人流量統(tǒng)計(jì)。
本案例技術(shù)的實(shí)現(xiàn)采用目前精度和速度都表現(xiàn)很好的多目標(biāo)跟蹤算法FairMOT,全部實(shí)驗(yàn)結(jié)果如下表所示(單卡NVIDIA Tesla V100)。通過(guò)嘗試不同的優(yōu)化策略,更改優(yōu)化器、損失函數(shù)、使用數(shù)據(jù)增強(qiáng)、增加可變形卷積(dcn)、開(kāi)啟跨卡同步batch normalization(syncbn)、使用指數(shù)移動(dòng)平均(EMA)、更換主干網(wǎng)絡(luò)等,模型的最高跟蹤準(zhǔn)確度(MOTA)達(dá)到71.7。更多優(yōu)化策略細(xì)節(jié)可以關(guān)注我們的直播課程。
用戶可以直接使用我們開(kāi)源的高精度行人檢測(cè)跟蹤模型進(jìn)行fine-tuning或完成其他任務(wù),如靜態(tài)場(chǎng)景下的人員計(jì)數(shù)任務(wù),助力公開(kāi)場(chǎng)合的人員管理工作。該技術(shù)方案還可以用于車流量統(tǒng)計(jì)、嫌疑人跟蹤等更多任務(wù)場(chǎng)景中。更多場(chǎng)景將在直播中解鎖~
安全帽檢測(cè)
在施工現(xiàn)場(chǎng),對(duì)于來(lái)往人員以及工作人員而言,安全問(wèn)題至關(guān)重要。而安全帽更是保障施工現(xiàn)場(chǎng)在場(chǎng)人員安全的第一防線,因此需要對(duì)場(chǎng)地中的人員進(jìn)行安全提醒。當(dāng)人員未佩戴安全帽進(jìn)入施工場(chǎng)所時(shí),人為監(jiān)管耗時(shí)耗力,而且不易實(shí)時(shí)監(jiān)管,過(guò)程繁瑣、消耗人力且實(shí)時(shí)性較差。
針對(duì)以上問(wèn)題,上海天覆科技有限公司基于百度同學(xué)自研、工業(yè)界表現(xiàn)超高性價(jià)比的PP-YOLOV2模型進(jìn)行實(shí)驗(yàn),獲得如下數(shù)據(jù)。
推薦使用backbone為ResNet50的PPYOLOV2模型,添加可變形卷積dcn、輸入圖像大小為608的情況下,安全帽ap高達(dá)96.83%,推理速度達(dá)到13.7fps。使用NV-Jetson進(jìn)行部署,實(shí)現(xiàn)很好的檢測(cè)效果。
2025-04-28 12:42
2025-04-28 12:41
2025-04-28 12:41
2025-04-28 12:40
2025-04-28 12:40
2025-04-28 12:39
2025-04-28 12:39
2025-04-28 12:38
2025-04-28 12:38
2025-04-28 12:37