無監督學習可以檢測未知的對抗性攻擊
2022年1月12日整理發布:人們越來越擔心機器學習模型成為許多關鍵應用程序的重要組成部分而產生的新安全威脅。威脅列表的頂部是對抗性攻擊,這些數據樣本經過不顯眼的修改以操縱目標機器學習模型的行為。
對抗性機器學習已成為熱門研究領域,也是人工智能會議上的演講和研討會主題。科學家們經常尋找新的方法來攻擊和防御機器學習模型。
卡內基梅隆大學和 KAIST 網絡安全研究中心的研究人員開發的一項新技術采用無監督學習來解決當前用于檢測對抗性攻擊的方法的一些挑戰。這項新技術在 ACM 知識發現和數據挖掘會議 (KDD 2021)的對抗性機器學習研討會(AdvML) 上發表,利用機器學習可解釋性方法來找出哪些輸入數據可能經歷了對抗性擾動。
創建對抗樣本
假設攻擊者想要發起對抗性攻擊,導致圖像分類器將圖像的標簽從“狗”更改為“貓”。攻擊者從未經修改的狗圖像開始。當目標模型處理此圖像時,它會返回已訓練過的每個類的置信度分數列表。具有最高置信度分數的類對應于圖像所屬的類。
然后,攻擊者在圖像中添加少量隨機噪聲,并再次通過模型運行。修改會導致模型輸出發生微小變化。通過重復該過程,攻擊者找到了一個方向,該方向將導致主要置信度得分降低而目標置信度得分增加。通過重復這個過程,攻擊者可以使機器學習模型將其輸出從一個類更改為另一個類。
對抗性攻擊算法通常具有一個epsilon參數,該參數限制允許對原始圖像進行的更改量。epsilon 參數確保對抗性擾動仍然無法被人眼察覺。
有多種方法可以保護機器學習模型免受對抗性攻擊。然而,大多數流行的防御方法在計算、準確性或通用性方面引入了相當大的成本。
例如,一些方法依賴于有監督的對抗訓練。在這種情況下,防御者必須生成大量對抗樣本并微調目標網絡以正確分類修改后的樣本。這種方法會產生示例生成和訓練成本,并且在某些情況下,它可能會降低目標模型在原始任務上的性能。它也不能保證可以抵抗未經訓練的攻擊技術。
其他防御方法需要防御者訓練一個單獨的機器學習模型來檢測特定類型的對抗性攻擊。這可能有助于保持目標模型的準確性,但不能保證能夠對抗未知的對抗性攻擊技術。
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯系刪除!
-
【如何按鍵盤重啟電腦】在日常使用電腦的過程中,有時候會遇到系統卡頓、程序無響應等情況,這時候可能需要通...瀏覽全文>>
-
【如何安裝一鍵還原】“一鍵還原”是一種常見的系統恢復工具,廣泛用于電腦的系統備份與恢復。對于普通用戶來...瀏覽全文>>
-
【如何安裝無線路由器怎么安裝路由器】在如今的生活中,無線路由器已經成為家庭和辦公環境中不可或缺的設備。...瀏覽全文>>
-
【如何安裝臺式機無線網卡】在日常使用電腦的過程中,有時會遇到臺式機沒有內置無線網卡的情況,導致無法連接W...瀏覽全文>>
-
【如何安裝攝像監控】在現代家庭和企業中,攝像監控系統已經成為保障安全的重要工具。正確安裝攝像監控不僅能...瀏覽全文>>
-
【如何安裝驅動】在使用電腦或外設設備時,驅動程序是確保硬件正常運行的關鍵。不同的設備需要對應的驅動程序...瀏覽全文>>
-
【如何安裝路由器】在家庭或辦公環境中,路由器是連接互聯網的關鍵設備。正確安裝路由器不僅能確保網絡穩定運...瀏覽全文>>
-
【如何安裝兩個微信怎樣安裝兩個微信】在日常生活中,很多人可能會遇到需要同時使用兩個微信賬號的情況,比如...瀏覽全文>>
-
【去游泳怎么念】在日常生活中,很多人可能會遇到“去游泳怎么念”這樣的問題。這通常是指對“去游泳”這個短...瀏覽全文>>
-
【去游泳用英語怎么說】在日常生活中,很多人會遇到需要表達“去游泳”這個動作的情況。無論是和外國朋友交流...瀏覽全文>>