成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ECCV 2024 | 讓GPT-4圖像理解更易出錯,全新策略增強VLP模型對抗遷移性

人工智能 新聞
近年來,ChatGPT-4等視覺 - 語言預訓練模型(VLP)展示了強大的多模態理解和生成能力,在圖像識別、文本生成等任務中表現出色。

本文作者分別來自南開大學、南洋理工大學和新加坡科技局。第一作者高森森為南開大學大四學生,此工作為其在新加坡科技局實習期間完成,實習導師為本文通訊作者郭青研究員(主頁:https://tsingqguo.github.io)。本文的共同第一作者和共同通訊作者是南洋理工大學的加小俊博后研究員(主頁:https://jiaxiaojunqaq.github.io)。

針對視覺-語言預訓練(Vision-Language Pretraining, VLP)模型的對抗攻擊,現有的研究往往僅關注對抗軌跡中對抗樣本周圍的多樣性,但這些對抗樣本高度依賴于代理模型生成,存在代理模型過擬合的風險。

為了解決這一問題,我們引入了對抗軌跡交集區域的概念。這個區域由干凈樣本、當前對抗樣本以及上一步對抗樣本所構成的三角形區域。通過利用這一區域的多樣性,我們不僅考慮了更加多樣化的擾動方向,還關注了干凈樣本周圍的對抗多樣性,從而提升了對抗樣本的遷移性。

本篇工作的論文和代碼均已開源。

圖片

  • 論文題目:Boosting Transferability in Vision-Language Attacks via Diversification along the Intersection Region of Adversarial Trajectory
  • 論文鏈接:https://arxiv.org/pdf/2403.12445
  • 代碼鏈接:https://github.com/SensenGao/VLPTransferAttack

研究背景

近年來,ChatGPT-4等視覺 - 語言預訓練模型(VLP)展示了強大的多模態理解和生成能力,在圖像識別、文本生成等任務中表現出色。然而,這些模型的強大性能也伴隨著一個顯著的安全隱患:對抗攻擊(Adversarial Attacks)。對抗攻擊是指通過對輸入數據進行微小且難以察覺的擾動,誘使模型產生錯誤輸出。這種攻擊方式不僅可以影響模型的預測準確性,甚至可能導致嚴重的安全問題。

由于 ChatGPT-4 等商業模型通常是閉源的,攻擊者無法直接訪問其內部參數和結構信息,這使得直接攻擊這些模型變得困難。然而,攻擊者可以通過對類似的開源或已知結構的 VLP 模型(如 CLIP)進行研究,生成對抗樣本并將其應用于閉源商業模型。這種方法被稱為對抗攻擊的遷移攻擊(Transfer Attack)

對抗攻擊的遷移性研究具有重要意義。一方面,了解對抗攻擊在不同模型間的遷移性,可以提高對這些商業閉源模型的攻擊成功率,從而幫助我們更好地評估和提升閉源模型的安全性,防止潛在的安全漏洞。另一方面,通過研究對抗樣本在不同模型上的表現,可以進一步優化對抗訓練方法,提高模型的魯棒性和抗攻擊能力。

動機

圖片

圖 1:現有方法對于 VLP 模型在代理模型和目標模型上的攻擊成功率 (圖片來源:SGA (arXiv:2307.14061))。

SGA (ICCV2023 Oral) 是第一篇探索對 VLP 模型進行遷移攻擊的工作,但實驗結果顯示在目標模型上的攻擊成功率遠低于代理模型。本研究的目標是探索 SGA 方法在目標模型上遷移性較差的因素,進一步提高對 VLP 模型遷移攻擊的成功率

圖片

圖 2:SGA 和我們方法的對比。

如圖 2 所示,SGA 采用迭代攻擊,并在迭代優化路徑上通過圖像增強(Resize)來增加對抗樣本的多樣性。然而,這種多樣性僅考慮了對抗圖像的周圍區域,而對抗圖像由代理模型生成,容易導致過擬合,從而降低了遷移性。

干凈樣本完全獨立于代理模型,因此我們認為干凈樣本周圍的對抗多樣性同樣重要。為此,我們利用對抗軌跡的交集區域構建更廣泛的多樣性,它由干凈圖像、當前對抗圖像和上一步對抗圖像構成。

方法

圖像模態

首先,我們在所提出的對抗軌跡交集區域中采樣多個圖像,并得到多樣化的對抗擾動方向:

圖片

隨后,我們使用文本引導進行采樣圖像的選擇:

圖片

此時即表示最佳的采樣圖像,我們同時采用了 SGA 的思想,通過圖像增強操作進一步探索最佳采樣圖像周圍的對抗擾動多樣性,最終的迭代表示為:

圖片

文本模態

過去的研究在生成對抗文本時,先通過迭代優化生成對抗圖像,隨后使對抗文本偏離最終生成的對抗圖像。然而,正如我們前面所述,對抗圖像高度依賴于代理模型,這樣生成的對抗文本也存在過擬合的風險。

我們提議讓對抗文本偏離沿對抗軌跡的最后一個交集區域,具體而言,對抗文本應偏離由原始圖像圖片、倒數第二個對抗圖像圖片和最終對抗圖像圖片構成的三角區域。此外,我們設置了可調節的系數因子,其中圖片

圖片

實驗效果

跨模型遷移性

下表 1 顯示了在圖像 - 文本檢索(Image-Text Retrieval, ITR)任務中跨模型攻擊的遷移性。相比于 SGA,我們的方法在多個跨模型遷移性上提升了 10% 以上。

圖片

跨任務遷移性

下表 2 顯示了利用在圖像 - 文本檢索(ITR)任務上預訓練的 ALBEF 模型,生成多模態對抗樣本,以攻擊 RefCOCO + 數據集上的視覺定位(VG)任務和 MSCOCO 數據集上的圖像描述(IC)任務。基線表示每個任務在沒有任何攻擊時的性能,較低的值表示對這兩個任務的對抗攻擊效果更好。

圖片

攻擊可視化

下圖 3 顯示了對視覺定位任務攻擊的可視化。

圖片

下圖 4 顯示了對圖像描述任務攻擊的可視化。

圖片

從圖 3 和圖 4 可以看出,通過對抗攻擊,使 VLP 模型在視覺定位和圖像描述任務上均出現了嚴重錯誤。

下圖 5 顯示了對 ChatGPT-4 遷移攻擊的可視化。

下圖 6 顯示了對 Claude-3 遷移攻擊的可視化。

圖片

我們分別將干凈圖像和對抗圖像輸入 ChatGPT-4,Claude-3 等大模型,并使用查詢「Describe this image.」得到輸出結果,我們從圖 5 和圖 6 可以看到,兩個大模型對對抗圖像的理解已經出現很大的錯誤。

結語

盡管該工作在提升多模態對抗攻擊遷移性方面取得了顯著效果,但如何更充分地利用對抗攻擊的交集區域,以及提供更深入的理論解釋,仍然是未來值得深入研究的方向。我們對對抗軌跡交集區域及其對 VLP 對抗攻擊遷移性的研究還在持續探索中,歡迎大家持續關注。如果有任何問題或進一步的想法,隨時歡迎討論。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-19 08:19:50

2025-04-16 09:35:03

2023-10-08 13:11:00

訓練數據

2023-12-26 08:17:23

微軟GPT-4

2023-12-04 12:56:08

AI數據

2023-05-22 08:30:35

GPT-4智能編程助手

2023-05-29 09:29:52

GPT-4語言模型

2023-04-09 16:17:05

ChatGPT人工智能

2023-08-15 15:03:00

AI工具

2025-05-30 07:40:56

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-10-14 17:24:49

2023-11-03 13:07:00

AI模型

2023-10-14 13:09:53

谷歌模型

2023-04-06 16:09:46

程序員AI

2023-08-17 08:00:00

2024-05-09 08:33:33

2023-07-13 12:54:42

GPT-4OpenAI

2021-07-13 17:38:49

算法語言模型GPT-4

2022-05-20 10:43:30

AI模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久久久久一区二区 | 成人做爰www免费看视频网站 | 日韩成人在线一区 | 国产一区二区三区免费观看在线 | 超碰人人艹 | 久久精彩视频 | 手机看片169| 亚洲另类自拍 | av在线免费网| 欧美性久久久 | 成人性视频免费网站 | 久久夜视频 | 日日夜夜精品视频 | 国产亚洲精品久久19p | 国产精品毛片一区二区在线看 | 国产九九九九 | 黑人精品欧美一区二区蜜桃 | 欧美成视频 | 国产欧美精品一区二区色综合朱莉 | 中文字幕一区二区三区乱码在线 | 日韩一区二区在线视频 | 欧美高清视频 | 国产91在线播放 | 国产精品久久久久一区二区三区 | 欧美a区| av毛片在线播放 | 国产xxxx岁13xxxxhd | 夜夜草导航 | 欧美福利久久 | av网站免费在线观看 | 99国产视频| 国产馆 | 欧美一级特黄aaa大片在线观看 | 成人亚洲性情网站www在线观看 | 久久久久亚洲精品 | 国产97视频在线观看 | 国产精品www| 免费一看一级毛片 | 国产精品一二三区 | av国产精品 | 国产极品粉嫩美女呻吟在线看人 |