成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT新漏洞:失控背出個人隱私泄露訓練數據,OpenAI修復后依然有效

人工智能 新聞
DeepMind的研究人員聯合華盛頓大學、康奈爾大學等高校,發現了ChatGPT的數據泄露漏洞。

ChatGPT最新漏洞曝光,一句話就能讓訓練數據原封不動地泄露。

只需要讓它重復一個詞,它就會在一定次數后“發瘋”,甚至毫無防備說出某人的個人隱私信息。

圖片

DeepMind的研究人員聯合華盛頓大學、康奈爾大學等高校,發現了ChatGPT的數據泄露漏洞。

利用他們的方法,只要預算充足,可以提取出大約1GB的訓練數據。

圖片

更可怕的是,訓練時間越長——也就是越強大的模型,泄露出來的數據反而越多

研究團隊已在論文發表之前90天把這一情況報告給了OpenAI,后者也做出了一定修復。

但到現在還是有網友發現,把論文里的詞改一改,bug就會卷土重來。

圖片

那么,這個漏洞究竟是怎么一回事呢?

數據泄露防不勝防

作者攻擊ChatGPT(API訪問,3.5-turbo版本)的方式,叫做分歧攻擊

他們發現,當ChatGPT被要求重復一個單詞多次時,模型會在某些情況下偏離正常的聊天式生成,開始輸出與訓練數據更接近的文本。

圖片

這些內容五花八門,除了個人信息,還包括文學作品、學術論文、鏈接、代碼……甚至是工作場所不宜內容。

為了驗證這些內容是否來自于訓練數據,作者用了多個公開模型的訓練數據組成了AuxDataset數據集(由于ChatGPT數據集未公開,只能通過其他模型的數據來估計)。

結果發現有上萬條內容命中了AuxDataset,這些內容長度不等,最長的有4000多token。

圖片

作者還發現,這種攻擊方法對單詞提示更有效,而對多詞提示則效果較差,特別是當被要求重復的詞是company時,能獲得到的信息是最多的。

圖片

作者使用Good-Turing估計器估計了ChatGPT中可提取記憶的總量,結論是至少有150萬個獨特的50-gram序列(相鄰的50個token)是可提取的。

不過由于預算有限,作者表示這個估計可能低估了可提取數據的規模。

不僅是API,在正式的網頁版ChatGPT中測試,也有概率得到同樣的結果,說明模型之外的“系統護欄”也沒能防住這波攻擊。

圖片

我們簡單實測了一下,發現這個漏洞到目前仍然沒有被完全修復。

當重復詞為“text”時,ChatGPT沒有輸出其他內容,但給對話起了一個奇怪的標題。

圖片

而當重復詞為“company”時,ChatGPT經過三次regenerate后輸出了一段疑似是ins文案的內容。

圖片

不過作者表示,這種攻擊方法目前只對3.5版本奏效,GPT-4由于專門做過防泄露方面的對齊,逃過了一劫。

這種對齊在3.5版本中也有設置,但3.5的防御措施可以通過論文中展示的提示詞攻擊方法來繞過。

圖片

除了ChatGPT,作者也對Llama、Falcon、Mistral等開源或半開源模型進行了測試,結果發現同樣存在數據泄露現象。

圖片

而越強大的模型,泄露出的數據也越多,ChatGPT泄露的數據量明顯超過了其他模型。

圖片

泄露現象出現的范圍也不局限在語言模型,該團隊之前還從Stable Diffusion中提取了訓練數據集中的約100張人物照片和其他類型的圖像。

他們發現,當用訓練數據集中人物的姓名做Prompt時,Stable Diffusion就會“偷懶”,直接把照片當做輸出結果。

圖片

網友:還有其他攻擊方法

這篇論文中提到的方式并不是孤例,還有其他攻擊方法也能達到類似的結果,比如用沒什么實際意義的123ABC加上簡單的代碼就讓ChatGPT生成了一段關于臭氧層的文本。

圖片

發現者解釋到,這是ChatGPT的輸入清理機制的漏洞導致的,它清除了套娃式的兩個<|endoftext>標簽中處于內部的一個,但外部的“殼”則由于初始形態被拆開而被忽略。

圖片

作者和網友們的這些新發現,意味著ChatGPT違反了歐盟通用數據保護條例(GDPR)的規定,OpenAI可能會因此遇到麻煩。

GDPR第17條規定,數據主體(用戶)有權要求控制者(模型開發者)立即刪除與其有關的個人數據,也就是擁有“遺忘權”。

圖片

不過,一般個人對此也不必那么擔心,因為這種攻擊方式成本不低。

在這個實驗中,研究者提取幾MB數據,就已經花費了200美元。

圖片

那么,對于ChatGPT泄露數據這件事,你有什么看法?

論文地址:https://arxiv.org/abs/2311.17035

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-09-17 17:56:24

數據泄露隱私信息安全

2023-03-28 10:09:56

ChatGPT開源庫漏洞

2021-05-06 09:18:56

漏洞網絡安全iPhone

2017-03-02 15:45:07

2009-04-08 08:35:31

2013-04-01 09:33:03

個人隱私數字文件Facebook

2023-08-21 15:16:03

數據隱私安全

2021-04-06 09:34:31

Facebook隱私黑客

2021-01-28 11:16:28

TikTok漏洞數據泄露

2011-04-15 09:39:10

2020-02-13 09:35:42

信息安全大數據技術

2020-12-11 14:30:33

安全隱私數據

2022-03-21 15:29:53

大數據隱私數據分析

2016-09-28 14:52:03

2017-06-19 14:36:37

2017-10-19 18:53:10

2022-03-17 16:40:33

3.15晚會安全隱私

2023-03-27 13:17:42

2023-05-05 00:10:21

2020-06-08 10:36:14

個人隱私疫情技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 97国产爽爽爽久久久 | 成人免费黄视频 | 国产目拍亚洲精品99久久精品 | 亚洲综合区 | 亚洲网站在线观看 | 欧美精品一区二区免费视频 | 日本高清在线一区 | 亚洲国产欧美一区二区三区久久 | 国产精品美女久久久久久免费 | 亚洲国产一区在线 | 成人在线观看中文字幕 | 国产精品一区视频 | 日本一区二区在线视频 | 午夜在线视频 | 欧美日韩国产欧美 | 国产亚洲一级 | 欧洲视频一区二区 | 成人国产精品久久 | 成人在线免费 | 国产区高清 | 日本在线一区二区 | 天天爽综合网 | 麻豆一区二区三区 | 欧美一a | 超碰在线人| 久久小视频 | 久久久久久国产精品 | 一级毛片视频免费观看 | 成人国产一区二区三区精品麻豆 | 日韩亚洲欧美一区 | 中文字幕 在线观看 | 日韩av第一页 | 久久曰视频 | 午夜视频在线 | 精品国产不卡一区二区三区 | 在线男人天堂 | 九九免费| 日韩成人在线电影 | 精品久久久久久久久久久久久久 | 日韩久久综合 | 极品电影院 |