伴隨人工智能技術(shù)對產(chǎn)業(yè)智能化升級進(jìn)程的推動作用不斷加深,AI模型的安全防護(hù)與隱私保護(hù)問題也日漸成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。
9月26日,百度安全正式對外發(fā)布了基于百度飛槳開源深度學(xué)習(xí)平臺的安全與隱私工具PaddleSleeve。以場景為驅(qū)動,覆蓋現(xiàn)實(shí)風(fēng)險(xiǎn),支持產(chǎn)業(yè)級模型,為企業(yè)和開發(fā)者打造更為貼近實(shí)踐應(yīng)用的模型安全強(qiáng)化選項(xiàng),開啟AI模型安全與隱私的新探索。
在同日舉行的2021 CCS成都網(wǎng)絡(luò)安全大會AI安全專題論壇上,百度安全部主任架構(gòu)師包沉浮詳細(xì)講解了PaddleSleeve的主要功能和關(guān)鍵能力。
百度安全部主任架構(gòu)師包沉浮在2021 CCS成都網(wǎng)絡(luò)安全大會發(fā)布PaddleSleeve
眾所周知,作為AI安全最為底層的保障環(huán)節(jié)之一,AI模型安全正面臨著多維和緊迫的安全挑戰(zhàn)。根據(jù)對目前已知攻擊行為的分析,攻擊者可通過數(shù)據(jù)投毒、模型后門等方式,在訓(xùn)練及預(yù)備部署階段即生成有缺陷的AI模型;而利用模型魯棒性自身存在的問題或借助模型竊取、數(shù)據(jù)提取等手段,其也能夠在部署階段非法獲取模型和隱私數(shù)據(jù)。
為此,包括Google Tensorflow、Facebook Pytorch在內(nèi)的不少國內(nèi)外主流深度學(xué)習(xí)平臺先后推出了相關(guān)安全工具,嘗試為上述一系列問題的解決提供研究支撐。依托百度飛槳,百度安全的PaddleSleeve則旨在提供一個(gè)不止于學(xué)術(shù)研究、更適應(yīng)于產(chǎn)業(yè)實(shí)踐的安全工具。以場景驅(qū)動、現(xiàn)實(shí)風(fēng)險(xiǎn)、產(chǎn)業(yè)級模型為三大核心理念,為有高安全性、高隱私性需求的場景提供端到端的安全技術(shù)支撐,并全面覆蓋AI模型所需應(yīng)對的從Security到Safety再到Privacy的各個(gè)層面的安全挑戰(zhàn)。
具體而言,PaddleSleeve可為企業(yè)和開發(fā)者帶來兩個(gè)層面的實(shí)用功能:
其一,在模型攻擊與評估層面,PaddleSleeve融合了百度安全Advbox對抗樣本攻擊及Robustness魯棒性評估等諸多能力,并新增了對飛槳2.X版本的支持,引入了更多前沿攻擊算法和模型集成遷移攻擊策略。同時(shí),聚焦于隱私性,PaddleSleeve也能夠支持AUC、Recall、結(jié)構(gòu)相似度、峰值信噪比(Peak SNR)等隱私攻擊效果評估指標(biāo),并可實(shí)現(xiàn)對模型數(shù)據(jù)被還原風(fēng)險(xiǎn)及模型是否存在關(guān)鍵信息泄露風(fēng)險(xiǎn)的檢測。
其二,在模型防御層面,PaddleSleeve支持多個(gè)業(yè)界前沿、性能良好的對抗訓(xùn)練方法,企業(yè)和開發(fā)者可通過新訓(xùn)練、模型精調(diào)等方式進(jìn)行對抗訓(xùn)練,并可借助多種過濾算法在不修改模型的情況下實(shí)現(xiàn)非侵入式的對抗魯棒性增強(qiáng)。而基于差分隱私擾動、梯度壓縮等方法的隱私增強(qiáng)優(yōu)化器,其也可幫助企業(yè)和開發(fā)者更為便捷地訓(xùn)練出可有效抵御常見隱私竊取攻擊的模型。
目前,PaddleSleeve已在多個(gè)場景中實(shí)現(xiàn)對飛槳自定義及預(yù)訓(xùn)練模型,ResNet、YOLO等通用產(chǎn)業(yè)級模型的支持。而伴隨一系列新功能的不斷加入,百度安全也希望與學(xué)術(shù)界、產(chǎn)業(yè)界持續(xù)展開合作,以場景為驅(qū)動,面向產(chǎn)業(yè)實(shí)踐,為AI模型安全與隱私保護(hù)提供更好的能力支撐。
秉承“有AI,更安全”的使命,百度安全始終致力于攜手多方力量共同推動AI安全開放生態(tài)的建設(shè)。作為一個(gè)開源項(xiàng)目,我們歡迎大家的加入,和我們一起推動PaddleSleeve功能的完善與拓展。
2025-04-29 22:24
2025-04-29 22:23
2025-04-29 22:22
2025-04-29 22:22
2025-04-29 22:21
2025-04-29 22:20
2025-04-29 22:19
2025-04-29 22:18
2025-04-29 22:17
2025-04-29 22:16