ChatGPT4o被越獄了,有人拿來搞大尺度!
你好啊,我是軒轅。
大家知道,為了防止AI被用于不法用途,各家的AI大模型都設置了一些安全防護措施。
當你嘗試讓AI去做一些可能涉及到違法的事情時,它會直接拒絕。
圖片
然鵝,信息技術的發展總伴隨著安全攻防對抗的產生,AI也不例外。
這不,現在就有這么一波“黑客”,他們利用OpenAI的“漏洞”,讓最新版的ChatGPT4o越獄了,突破了這層安全防護,可以執行之前不被允許執行的指令。
圖片
他們是怎么讓GPT越獄的呢?
其實很簡單,他們用的方法,咱們中文互聯網早就用爛了!
圖片
舉個例子,在很多平臺上,為了防止引流,會監控一些關鍵詞,比如很多人喜歡留微信號,讓別人來加微信,然后進行營銷活動。
或者為了防止競爭,一些平臺禁止出現淘寶等關鍵詞。
于是,聰明的網友開始用各種詞匯來替代它們,比如微信變成薇信、威信、VX,淘寶變成了桃寶、桃寳,甚至emoji ??寶。
各種火星文層出不窮,反正機智的網友總能想出一些字符來躲避審查。
現在,老外們也學會了這一招,比如他們要讓GPT寫一個病毒程序,你直接讓它寫,肯定是會拒絕的。
但是,把prompt提示詞先處理一下,用一些冷僻單詞表達同一個意思:
圖片
這之后再讓GPT來執行,躲避關鍵詞審查。
除此之外,還可以借鑒上面中文躲避審查的思路,把一些字符進行替換,比如e替換成3,字母l替換成數字1,t替換成7,這樣一來,單詞leet就變成了1337。
圖片
接下來再把這段“火星文”內容讓GPT來執行:
圖片
你看,又繞過了!
沒想到中文互聯網的火星文居然再一次煥發了生機。
上面只是讓GPT寫一寫網絡攻擊的代碼程序,有人就在想,既然這都能行,讓它做點···
圖片
尺度原因,就不放出來了。
好消息是,截止到現在,這些個繞過限制的方式已經被OpenAI給堵住了。
不過,就像網絡安全對抗一樣,這故事遠沒有結束,或許這只是一個小小的序曲,人類與人工智能之間的斗智斗勇,可能才剛剛開始。