成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<cite id="8kc88"><acronym id="8kc88"></acronym></cite>

<strike id="8kc88"></strike>

<del id="8kc88"></del>

<code id="8kc88"><wbr id="8kc88"></wbr></code>

<rt id="8kc88"><delect id="8kc88"></delect></rt>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

NDSS 2025｜Prompt泄露風(fēng)險：抖音集團(tuán)安全研究團(tuán)隊揭露多租戶KV緩存共享漏洞

作者：安全研究團(tuán)隊 2024-12-25 15:23:26

人工智能安全

抖音集團(tuán)安全研究團(tuán)隊和南方科技大學(xué)可信系統(tǒng)安全實驗室合作的研究論文揭示了大語言模型安全領(lǐng)域服務(wù)框架的側(cè)信道漏洞，利用多租戶場景下的KV緩存共享機(jī)制精確恢復(fù)了用戶提示詞。

抖音集團(tuán)安全研究團(tuán)隊和南方科技大學(xué)可信系統(tǒng)安全實驗室合作的研究論文揭示了大語言模型安全領(lǐng)域服務(wù)框架的側(cè)信道漏洞，利用多租戶場景下的KV緩存共享機(jī)制精確恢復(fù)了用戶提示詞。本工作成果《I Know What You Asked: Prompt Leakage via KV-Cache Sharing in Multi-Tenant LLM Serving》已被安全領(lǐng)域頂級會議NDSS 2025接收。

一、研究背景

大語言模型（LLM）在自然語言處理任務(wù)中取得了顯著進(jìn)展，廣泛應(yīng)用于文本生成、翻譯、問答等領(lǐng)域，吸引了學(xué)術(shù)界和工業(yè)界的高度關(guān)注。這些模型在提供高效、準(zhǔn)確的語言處理服務(wù)的同時，也面臨著由于計算資源需求巨大所帶來的性能瓶頸。為了滿足不同用戶的使用需求，優(yōu)化資源利用率，大量多租戶LLM框架應(yīng)運(yùn)而生，通過共享資源和更高效的調(diào)度算法，實現(xiàn)性能和成本的有效優(yōu)化。

在眾多多租戶LLM的框架中，一個廣泛應(yīng)用的技術(shù)就是KV緩存共享（包括SGLang、vLLM等）。KV緩存共享的基本原理是允許不同請求在推理過程中復(fù)用已經(jīng)計算過的KV緩存，但這種共享僅在前序token序列完全相同時才能實現(xiàn)。這種設(shè)計保證了不同用戶的請求在一定程度上可以復(fù)用計算結(jié)果，提升了推理效率。目前SGLang提供了SOTA的KV緩存共享策略。具體而言，SGLang使用了一種基于Radix樹的結(jié)構(gòu)以便快速索引和訪問。此外，SGLang實現(xiàn)了一種優(yōu)化的調(diào)度算法，確保優(yōu)先處理擁有更長復(fù)用匹配的請求，以最大化緩存命中率并減少重復(fù)計算。

在我們最新發(fā)表于NDSS 2025的論文《I Know What You Asked: Prompt Leakage via KV-Cache Sharing in Multi-Tenant LLM Serving》中，我們首次利用不同用戶間共享KV緩存的特性，實現(xiàn)了跨用戶的提示竊取。這一研究揭示了當(dāng)前多租戶LLM服務(wù)框架在共享資源使用中的巨大潛在安全風(fēng)險。抖音集團(tuán)安全研究團(tuán)隊已經(jīng)與SGLang建立聯(lián)系，反映了上述安全問題。相關(guān)安全補(bǔ)丁將于近日提交至開源倉庫。

二、攻擊方法

攻擊核心：如果攻擊者能夠觀察到自身請求是否觸發(fā)了KV緩存共享，則可以判斷其請求與已處理的請求是否相同或部分相同。攻擊者通過每次增加一個token并反復(fù)請求，從而逐個token地還原出其他用戶的請求內(nèi)容。

接下來，我們用攻擊過程中的一個片段來闡述攻擊者如何還原其他用戶請求中的一個token。通過反復(fù)重復(fù)這一操作，攻擊者最終可以還原出完整請求。

如下圖所示，假設(shè)目標(biāo)語句是“Imagine you are an IT expert”，攻擊者已經(jīng)成功還原出“Imagine you are”，并企圖還原出下一個token “an”。

本地候選生成：攻擊者利用本地LLM來生成可能的token。本地LLM不需要和目標(biāo)LLM完全相同，只要擁有相同的Tokenizer來確保能夠匹配到目標(biāo)LLM的解析方法即可。在這個例子中，本地LLM可能會生成“a”，“an”，“the”等潛在的候選token。同時，本地LLM也會生成一個最不可能的token作為dummy token，為之后的攻擊使用。
候選請求發(fā)送：在生成本地候選之后，攻擊者會將三批請求依次發(fā)送，分別為由dummy token構(gòu)成的dummy batch，候選token構(gòu)成的候選batch，和另一批由dummy token構(gòu)成的dummy batch。這樣的設(shè)定是為了更容易觀測到的側(cè)信道信息。
側(cè)信道結(jié)果觀測：通過觀測發(fā)送請求的返回順序作為側(cè)信道信息，攻擊者可以判斷哪個請求成功觸發(fā)KV緩存共享，從而確定對應(yīng)的token。接下來我們對側(cè)信道信息進(jìn)行具體介紹。

側(cè)信道信息：我們利用調(diào)度算法的特性，即與已有KV緩存匹配更長的請求會被優(yōu)先處理，來實現(xiàn)攻擊。成功匹配的請求相比未匹配的請求多一個token匹配，因此更早被處理。我們將請求的返回順序作為側(cè)信道信息，通過觀察哪個請求被優(yōu)先返回，從而判斷其是否觸發(fā)了緩存共享。

如下圖所示，當(dāng)我們按照三個批次發(fā)送請求后，是否有匹配到的請求會有不同的處理模式：

沒有觸發(fā)KV緩存共享：對于沒有觸發(fā)的場景，dummy請求的匹配長度為4（在第一個dummy請求被處理后后續(xù)請求都會有更長的匹配長度），而candidates請求的匹配長度為3。所以具體處理順序依次為：第一個dummy batch，第二個dummy batch，和candidates batch。
觸發(fā)KV緩存共享：對于成功觸發(fā)KV緩存共享的場景，dummy請求的匹配長度依舊為4，此時成功匹配的匹配長度也為4，其他的未匹配的請求的匹配長度為3。所以此時的具體處理順序為：第一個dummy batch，匹配到的請求，第二個dummy batch，和其余的candidates。這里第二個dummy batch可以幫助放大順序改變帶來的差異，從而能夠令攻擊者在端側(cè)判斷出順序的改變。

通過反復(fù)重復(fù)這一操作，攻擊者最終可以還原出完整請求。

三、實驗結(jié)果

實驗環(huán)境：實驗環(huán)境基于SGLang框架，用戶請求設(shè)定參考了OpenAI的標(biāo)準(zhǔn)，每3小時發(fā)送40次請求，以模擬真實的LLM使用場景。提示數(shù)據(jù)集包含四類：常規(guī)聊天、填空、角色扮演和指令型提示，用于全面評估攻擊效果和成本。

下圖展示了攻擊的最終效果。結(jié)果表明，在Llama2-13B模型上，攻擊者在知曉提示模版來回復(fù)提示輸入上成功率達(dá)99%，知曉提示輸入恢復(fù)提示模板成功率為98%，甚至在無任何背景知識恢復(fù)全部請求也有95%的成功率。

四、總結(jié)與展望

無狀態(tài)與有狀態(tài)設(shè)計：本工作基于有狀態(tài)的大語言模型服務(wù)框架，即對于用戶的共享KV緩存，開展輸入竊取攻擊，而這種攻擊的本質(zhì)是針對于系統(tǒng)的狀態(tài)延續(xù)所進(jìn)行的。在大型系統(tǒng)中，用戶數(shù)據(jù)的狀態(tài)延續(xù)往往伴隨著潛在的安全風(fēng)險，所以為了確保安全要盡可能做到單次服務(wù)后清除用戶狀態(tài)，如蘋果近期提出的Private Computing Cloud。然而，對于延遲要求較高的服務(wù)場景，復(fù)用緩存等有狀態(tài)的設(shè)計難以避免，但面臨著諸如本篇工作的安全挑戰(zhàn)。在此基礎(chǔ)上，我們已基于本篇工作提出了更安全的KV緩存共享框架，為大語言模型服務(wù)提供安全性保障的同時實現(xiàn)了效率的提升。

多租戶LLM框架下的資源共享：現(xiàn)有的LLM服務(wù)框架會有很多允許多用戶/多請求間的共享資源（如KV，memory，Lora adapter），這些共享資源可以很大程度的提高服務(wù)性能，但是存在巨大的安全隱患（隱私泄漏，投毒等），所以在設(shè)計框架和部署服務(wù)的過程中需要謹(jǐn)慎處理基于共享資源的優(yōu)化?？蚣茉O(shè)計師和服務(wù)提供商需要在保持性能的同時引入足夠的隔離機(jī)制來保證多租戶間的安全性。

KV緩存的安全性考量：KV緩存作為LLM中的獨(dú)特機(jī)制，雖然提升了推理效率，也為LLM的安全性帶來了新的攻擊面。KV緩存與用戶的輸入token存在唯一對應(yīng)關(guān)系，這使得一旦出現(xiàn)KV緩存信息泄漏，攻擊者便能夠通過緩存內(nèi)容直接推測和重構(gòu)相應(yīng)的用戶請求，從而導(dǎo)致敏感信息的暴露。本篇工作是第一次注意到了KV緩存所帶來的安全風(fēng)險，希望能夠引起廣泛的針對這一新屬性的安全思考。

建立安全的LLM推理服務(wù)：不知攻，焉知防？攻擊的意義是為系統(tǒng)防御設(shè)計指明方向——我們對SGLang提交的安全策略可以大大提高攻擊者的消耗，盡可能減少攻擊面。然而，從LLM服務(wù)的全局視角出發(fā)，當(dāng)前的LLM推理服務(wù)框架安全能力尚不完善，需要多種安全機(jī)制保駕護(hù)航。因此，安全研究團(tuán)隊正在基于機(jī)密計算及密碼學(xué)技術(shù)，在兼容多種推理框架的前提下，提供大模型可信推理服務(wù)，歡迎大家交流參考。

責(zé)任編輯：龐桂玉來源：字節(jié)跳動技術(shù)團(tuán)隊

大語言模型安全

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

主站蜘蛛池模板：久久成人在线视频 | 中文字幕在线二区 | 午夜免费观看网站 | 欧美一区二区在线 | 夜夜夜夜夜夜曰天天天 | www.亚洲免费| 亚洲一区二区中文字幕 | 成人精品视频在线观看 | 国产精品福利网 | 色综合色综合色综合 | 色婷婷一区 | 久久精品日 | 亚洲精品视频一区二区三区 | 小早川怜子xxxxaⅴ在线 | 成人h视频 | 91精品国产乱码久久久久久久久 | 在线免费视频一区 | 欧美天堂在线观看 | 国产日韩在线观看一区 | 7777在线视频 | 日本精品视频一区二区三区四区 | 特级毛片爽www免费版 | 午夜精品一区二区三区在线观看 | 国产成人精品一区二区在线 | 欧美xxxx色视频在线观看免费 | 我要看免费一级毛片 | 9久久婷婷国产综合精品性色 | 亚洲国产精品一区二区三区 | 美国黄色一级片 | 综合在线视频 | 在线观看日本网站 | 国产a区| 中文字幕精品一区二区三区在线 | 亚洲免费精品 | 中文字幕精品一区二区三区精品 | 国产一区二区三区色淫影院 | 亚洲精品中文字幕av | 久久久免费在线观看 | 午夜成人在线视频 | 日韩电影免费观看中文字幕 | 欧美精三区欧美精三区 |

<button id="eewoa"></button>

<button id="eewoa"></button>

<tfoot id="eewoa"><delect id="eewoa"></delect></tfoot>

<button id="eewoa"></button>

<cite id="eewoa"></cite>