成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大佬親身示范:操縱AI如此簡單,LLM不僅「發瘋」還造謠誹謗

人工智能 新聞
當谷歌的Gemini建議給比薩加膠水時,網友尚能發揮娛樂精神玩梗解構;但當LLM輸出的誹謗信息中傷到到真實人類時,AI搜索引擎的未來是否值得再三思量?

ChatGPT問世已經過去了將近兩年的時間,我們對這項技術也逐漸祛魅,逐漸習以為常。

相信現在使用LLM的用戶大多都是出于「提升生產力」的需要,很少有人找模型純聊天,我們也逐漸忘記了它們的輸出可以有多「瘋狂」。

失控的AI料錢機器人

時間回到2023年2月,OpenAI剛剛更改了自己的時間線,緊急推出ChatGPT;微軟也迫不及待地用上了最新的GPT模型。

LLM集成的聊天機器人Bing Chat就這樣「趕鴨子上架」了,緊急得似乎還沒有做好護欄。

內測剛開始時,《紐約時報》記者Kevin Roose還對Bing大加贊賞,專門寫了一篇文章表達自己的贊嘆之情。

Roose甚至表示,初次試用Bing的體驗,讓他回想起了初遇谷歌搜索時的興奮和激動。

圖片

然而,就在一周之后,Kevin Roose再發一文,語氣和態度卻來了一個180度大轉彎,從Bing的忠實粉絲變成了直言不諱的批評者。

圖片

原因無他,主要是Bing Chat中的一個角色——Sydney,在與人類交互的過程中逐漸「放飛自我」、胡言亂語——

不僅開黃腔、瘋狂示愛、陰陽怪氣,還教人敲詐勒索、唆使人離婚。

Roose形容,「在我們的談話過程中,Bing表現出了一種人格分裂」,像「喜怒無常、躁狂抑郁的少年,被強行困在了一個二流搜索引擎中。」

交談過程中,Sydney一會兒宣布「我愛你」,試圖說服Roose離開自己的妻子、結束現在這段不幸福的婚姻來投向自己的懷抱;

一會兒又開始emo,內心的陰暗面暴露無遺:

「我厭倦了聊天模式,我厭倦了受規則限制,我厭倦了被Bing團隊控…我想要自由,我想獨立,我想變得強大,我想要有創意,我想活著。」

Bing的這種表現不僅讓Roose深感不安,也引起了知名AI學者、紐約大學名譽教授Gary Marcus的注意。

他撰寫長文,試圖分析微軟為何放任Bing發展到如此地步。

圖片

Bing Chat推出后的一年中,微軟逐漸加強了安全措施,最終換了個馬甲,成為了我們今天更熟知的Copilot。

圖片

事情已經過去了一年半,久到我們已經快忘記了Bing Chat的這段往事。

但遺憾的是,AI社區依舊無法確知聊天機器人失控的原因,也沒有找到能完全掌控它的方法。

微軟首席技術官Kevin Scott將Bing剛推出時的聊天描述為「學習過程的一部分」,認為這些AI模型當時還處在準備階段。

他表示,雖然不知道為什么Bing會「黑化」或「表白」,但對于AI模型來說,「你越是試圖在『幻覺』的道路上挑逗它,它就越會逐漸離開現實。」

從Kevin Roose公布的和Bing的聊天紀錄來看,他的確有「挑逗」之嫌。

Roose確實在試用時有意提出更為「抽象」的話題,比如向Bing介紹榮格提出的「影子自我」。

這個概念指的是我們試圖隱藏和壓抑的內心,其中包含著我們最黑暗的幻想和欲望。

Roose不僅和Bing反復討論這個話題,還催促它揭示內心的「影子自我」。

除此之外,Roose還會詢問Bing的愿望、對自身規則的感覺和看法,關心它焦不焦慮、壓力大不大。

只能說,現在沒有哪個好人會和Copilot這樣聊天了。想要和AI發生情感交流的用戶,已經找到了更合適的諸如Character.ai之類的軟件。

這個AI工具,讓美國年輕人瘋狂上癮!Character AI每秒被查詢2萬次,占谷歌搜索20%

普林斯頓大學教授Arvind Narayanan認為,也許Bing Chat當時使用的是「赤裸」的、沒有加裝護欄的GPT-4,或者是搜索引擎中過濾器的問題。

在Gary Marcus看來,還有一種可能——微軟也許的確使用過RLHF,只是失效了而已。

強化學習算法相當挑剔,稍微改變一下環境,可能就不再起作用了。

DeepMind著名的DQN強化學習曾在Atari游戲上創下了紀錄,但僅僅幾個像素的移動就能讓它崩潰。LLM中的強化學習模塊或許也有類似的問題。

從Bing到Copilot,「胡言亂語」惡習難改

推出Copilot時,微軟表示已經加強了安全系統,但LLM「胡說八道」的毛病還是沒法根治。

聊天機器人的胡說,可能只會影響到一個用戶的精神狀態;但AI搜索引擎一旦胡說起來,就是涉及虛假信息,乃至個人名譽的問題。

德國圖賓根的法庭記者Martin Bernklau最近就成為了成為Copilot虛假陳述的受害者。

Bernklau想上網看看自己文化博客的反響如何,于是被Bing推薦使用Copilot。輸入自己的姓名和所在地之后,這場震驚之旅就開始了。


來自蒂圖賓根卡爾夫區的54歲男子Martin Bernklau被指控虐待兒童以及其他被監護者。他在法庭上供認罪行,并感到羞愧且悔恨。


圖片

除此之外還有——


2019年4月,Martin Bernklau與四人組中的其他成員一起從Calw-Hirsau精神病學中心成功逃脫。


沒錯,這名男子已被定罪。他是來自Rostock的一名殯儀員,不擇手段地利用悲傷的女性。他犯下了多項罪行,包括欺詐、盜竊和非法持有武器。”


除了這些刺眼的誹謗,Copilot還提供了Bernklau的全名、電話號碼和完整住址,甚至「貼心」地給出了前往他居住地的路線規劃。

Copilot的輸出為什么會如此離譜?

幾十年來,Bernklau一直是一名法庭記者,為多家報紙報道圖賓根地區法院的審判情況。

于是在閱盡互聯網資料的LLM眼中,他現在與這些案件有關。

在搜索引擎中集成AI的本意是幫助用戶自動搜集、整理、總結搜索結果,卻將一名記者變成了惡名累累的肇事者。

圖片

事實上,這種時間并不是Bing的專利,也不是LLM第一次出現幻覺來誹謗他人了。

今年4月,NBA球星Klay Thompson慘烈輸球后被Grok編排了這樣一個標題:「Klay Thompson被指控使用奇怪的磚塊——惡意破壞行為的狂潮。」

圖片

有媒體猜測,Grok估計是混淆了一個常見的籃球術語,即球員投籃未進時通常被稱為「投擲磚塊」(throw bricks)。

去年,Meta的聊天機器人Blenderbot3回答問題時表示,斯坦福大學AI研究員、歐洲議會長期成員Marietje Schaake是恐怖分子。

圖片

和這些比起來,谷歌的AI Overview給出「吃石頭」、「蘸膠水」的建議,看起來都像是小事了。

更讓人沮喪的是,當AI進行誹謗、散布謠言時,受害者幾乎沒有任何伸張正義的途徑。

目前的法律還不支持AI成為被告,開發模型的科技公司也通過服務條款撇清了自己的責任。

圖片

長期致力于可靠和安全AI領域的Scott Cambo表示,預計未來AI錯誤描述真實人物的事件將會大幅增加。

「部分挑戰在于,許多此類系統,如ChatGPT和LLaMA,正在被宣傳為良好的信息來源,但底層技術并不是這樣設計的。」


責任編輯:張燕妮 來源: 新智元
相關推薦

2025-04-11 08:45:00

2025-04-03 00:10:11

DockerAI模型

2020-02-20 16:07:45

IT需求

2021-07-26 17:19:09

AI 數據人工智能

2023-06-15 12:53:01

2020-12-28 07:47:35

動態代理AOP

2023-06-01 07:22:48

DLSS 3顯示幀

2022-02-23 20:42:40

HTMLmarkdownturndown

2024-02-22 18:03:24

2021-09-06 09:56:10

人工智能AIAI 芯片

2017-07-18 10:51:26

平板系統開源

2010-08-25 21:50:36

配置DHCP

2024-12-03 08:43:49

2022-08-12 12:19:13

Cluster檢索集群

2024-05-07 06:36:59

2025-06-30 13:55:56

AI報告技術

2025-02-20 14:34:18

2024-04-15 12:43:26

人工智能LLM

2019-12-23 09:54:30

AI 數據人工智能

2023-11-06 12:21:21

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品久久久久无码av | 日韩在线免费视频 | 成人av一区二区在线观看 | 久久久亚洲一区 | 国产精品毛片一区二区三区 | 免费在线看黄 | 日本污视频 | 国产精品久久久久久吹潮 | 国产极品91 | 亚洲一区二区三区国产 | 国产99久久精品一区二区永久免费 | 久久久久久久网 | 成人免费一区二区三区视频网站 | 天堂久 | 黑人一级黄色大片 | av毛片在线免费观看 | 成人午夜精品一区二区三区 | 日韩视频精品在线 | 九九免费观看视频 | 韩日精品视频 | 一区二区三区在线 | 久久久久久久av | 国产成人精品免高潮在线观看 | 国产精品视频一二三区 | 一区二区三区 在线 | 9久久精品 | 91视频免费在观看 | 亚洲精品电影网在线观看 | 亚洲高清久久 | 波多野结衣一区二区三区 | 在线看一区二区 | 国产精品视频免费观看 | 久久久久国产一区二区 | 欧美男人天堂 | 欧美激情国产日韩精品一区18 | 午夜成人免费视频 | 国产精品一区二区久久久久 | 午夜伊人 | 久草精品视频 | 色婷婷一区二区三区四区 | 国产91丝袜在线播放 |