倒反天罡:ChatGPT教人說話?36萬視頻+77萬播客已證實!
AI馴服人類第一步:教人重新說英語?
最近,越來越多的媒體發現:說話的方式,越來越像ChatGPT了!
這不是模仿,而是「入侵」。
潛移默化之中,人類被AI「同化」:
AI不僅入侵了你的筆端,
還悄悄占領了你的大腦。
最終,從你口中傾瀉而出!
說英語的小心了!
ChatGPT正給你洗腦
最新的arxiv預印給出了驚人的結論:ChatGPT可能正在悄悄改變我們的用詞習慣。
無論你覺得它方便,還是感到不安,ChatGPT都已悄然成為寫作、搜索甚至日常對話的常駐嘉賓,一點點重塑我們的語言和思維方式。
此同時,網絡上掀起了熱議:
是否能通過「破折號」這類細節,一眼識破AI寫的內容?
答案或許正在改變。
然而,這項新研究卻給了出人意料的答案:「AI痕跡」正在變得越來越難以識別——因為人類的語言風格,正在越來越像ChatGPT。
研究人員發現,自ChatGPT推出以來,短短18個月,人們在日常交流中使用的所謂「GPT詞匯」(GPT words)飆升。
這是來自德國馬普人類發展研究所(Max Planck Institute for Human Development,MPIB)的最新的研究。
論文鏈接:https://arxiv.org/abs/2409.01754
已有研究指出ChatGPT會影響人類的書面表達方式,但這一次,研究者想知道,AI的迅速普及是否也正在悄悄改變我們的「說話方式」。
為了這項研究,數百萬頁的電子郵件、文章、學術論文和新聞報道上傳到ChatGPT,進行潤色。
然后,研究人員分析AI更偏好的詞匯,比如「delve」「realm」「meticulous」等。他們稱這些為 GPT詞匯。
隨后,在超過36萬個YouTube視頻、77萬個播客片段中,他們追蹤這些詞匯的使用頻率變化,發現了驚人的上升曲線!
圖2:量化ChatGPT的詞匯偏好及其對人類交流的影響
(A)學術YouTube報告中「delve」一詞使用量的時間趨勢圖,顯示ChatGPT發布后該詞使用量顯著增加(與合成對照組相比p=0.010)
(B)ChatGPT詞匯偏好測量方法:通過對比人工撰寫文本與ChatGPT修改版本的詞頻分布,計算得出的對數比值(即GPT分數)可量化特定詞匯被ChatGPT偏好的程度
(C)由GPT分數測得的ChatGPT特征性詞匯(GPT詞匯集),不同版本ChatGPT對「delve」的強烈偏好具有一致性
(D)通過供體詞匯的凸組合構建具有相似發布前模式的合成對照組,用于推斷因果影響
這項最新的研究卻告訴我們一個有趣的事實:這些「AI口音」可能越來越難以發現——因為人類的說話方式,正在逐漸變得像ChatGPT。
即便排除同義詞和腳本化內容的影響,研究發現在英語口語中,GPT詞匯確實的使用率顯著攀升。
這項研究發人深省,但也有一些值得注意的限制。
首先,研究人員分析的數據來自特定的GPT模型:GPT-4、GPT-3.5-turbo、GPT-4-turbo和GPT-4o。這使得研究局限于這些特定版本的ChatGPT。
在未來幾個月和幾年中,OpenAI無疑會推出新的模型,而這些新版本可能會展現出新的語言使用形式和詞匯偏好。
因此,這項研究可能很快過時。
此外,目前還不清楚ChatGPT是否確實對更隨意的口語表達有影響,特別是考慮到研究人員從學術來源中獲取了大量數據。
而且,語言和詞匯的使用會隨著時間因多種因素而不斷演變;雖然ChatGPT可能在某種程度上對我們使用的詞匯變化有所貢獻,但重要的是要指出社會和文化中許多其他來源也促成了語言的變化。
「偽人」崛起
共同作者Levin Brinkmann對媒體解釋過:「AI技術存儲的語言模式,正在反哺人類思維。人類天生會相互模仿,但主要針對那些知識淵博或德高望重的人。我們更傾向于復制他們的語言行為?!?/span>
Levin Brinkmann:馬克斯·普朗克人類發展研究所研究員,專注于研究機器與人類社會日益深化的融合進程。他采用復雜系統理論、機器學習與實驗社會科學方法,探究人機混合系統的演化規律。他獲得計算社會科學博士學位,以及哥廷根大學物理學碩士學位
換言之,人與AI之間正在形成一種文化反饋循環:我們使用書面文本訓練AI,AI將統計重構后的文本回傳給我們,而我們捕捉到這些模式后,便開始無意識地模仿它們。
研究指出,越來越多人將AI視為文化權威,這使得「最初基于人類數據訓練的機器,在形成自身文化特征后,可量化地重塑人類文化」。
Brinkmann強調:
「delve」只是冰山一角,其他高頻GPT詞匯還包括:
「underscore」(強調)、「comprehend」(理解)、「bolster」(支持)、「boast」(擁有)、「swift」(迅速)、「inquiry」(調查)、「groundbreak」(開創性)……
圖3(a):高頻GPT詞匯出現頻次與合成對照組的線性回歸分析。圓點表示月度聚合頻次,趨勢線標注以虛線標記的轉折時點。如「comprehend」(理解)、「boast」(擁有)、「swift」(迅速)等詞匯與「delve」類似,均呈現顯著增長
圖3(b):詞匯的GPT分數(x軸)與其使用趨勢變化幅度(y軸)的關聯性。柱狀圖表示后驗分布的95%高密度區間,插圖中陰影區域為高斯過程回歸的95%置信區間。聚焦前20個GPT詞匯(插圖最右側),可觀測到一組年增長率約25%-50%的詞匯
盡管這項研究主要聚焦在詞匯層面,但許多研究人員已經注意到,AI的影響正逐步滲透到語氣當中——
比如說話變得更長、更有條理,同時情緒表達也被削弱。
康奈爾大學的研究發現,在聊天中使用智能回復會讓人們更有合作意識,也能增進彼此的親密感,因為使用者傾向于選擇更正面、更有情感的語言。
然而,一旦人們察覺對方可能在用AI,反而會覺得對方不夠誠懇,從而態度變得更強硬。關鍵并不是對方真的用了AI,而是那種「懷疑」的感覺。
論文鏈接:https://www.nature.com/articles/s41598-023-30938-9
正如該研究合著者、康奈爾大學信息科學副教授Malte Jung所說,我們是根據語言特征來判斷他人,而真正影響我們印象的,是那些語言本身的性質。
Malte Jung的研究旨在探討群體和團隊中的人際互動動態,以及這些動態如何受到機器的影響
康奈爾理工學院信息科學教授Mor Naaman指出,這種「AI既改善溝通又引發猜疑」的矛盾現象,折射出更深層的信任危機。
Mor Naaman是康奈爾大學科技校區、雅各布斯技術與康奈爾研究所及康奈爾安·鮑爾斯計算與信息科學學院的教務長事務副院長,同時也是Don and Mibs Follett信息科學教授。他專注于技術、媒體等交叉領域的課題。他在斯坦福大學InfoLab獲得了計算機科學博士學位。此外,他還曾效力于籃球隊,作為職業籃球運動員參賽
他提出在AI溝通中,人性喪失的三重信號:
第1層信號:人性。那些笨拙、結巴的語氣,才是「我真的在說話」。
第2層信號:用心。不是復制粘貼,而是花時間打下每一個字。
第3層信號:能力。真正的個性,是用真實語言展現幽默、情緒與深度。
你說的話里,藏著你是誰;一旦AI代言,我們也許就不再是「自己」。
Naaman認為,AI中介溝通的未來在于重建并強化這些信號,因為AI不僅改變語言,更重塑思維。
在約會軟件上,當AI能替你展現幽默時,個人資料中的「幽默」還有何意義?
他最擔憂的是從語言到思維的主體性喪失:「我們不再表達真實想法,而是表達AI幫我們組織的內容...我們會越來越被其說服?!?/span>
他警告,若失去這些信號,人類將只信任面對面交流——甚至不信任視頻通話。
AI偏愛英語「倫敦腔」?
當AI悄然定義何為「得體」語言時,信任危機更趨復雜。
加州大學伯克利分校研究發現,AI偏好「標準英語」:
當用戶嘗試用新加坡英語、黑人英語等表達時, AI的反饋常常失真、夸張,甚至令人不適。
這不僅是語言問題,更關乎文化的尊重。
論文鏈接:https://arxiv.org/abs/2406.08726
一位說新加坡英語的網友評論道:「回復里夸張的新加坡式英語讓人尷尬?!?/span>
研究表明AI不僅偏愛標準美式英語,還會通過壓制其他方言來貶低使用者。
這種機制不僅固化對族群的錯誤認知,更扭曲了「正確」英語的標準。
因此這不僅關乎保護語言多樣性,更關乎守護那些真正建立信任的不完美特質。
當周圍人都開始說「正確」英語時,我們將失去那些結巴表達、地方俚語和非常規短語——這些正是脆弱性、真實性和人格的信號燈。
我們正處在分岔路口,矛盾重重:
學術界抵制「delve」等用詞、人們刻意避免AI腔等反彈現象,顯示人類可能自我調節對抗同質化;
AI系統本身或將更具表現力和個性化,從而緩解當前的「AI腔」問題;
而最深層的風險并非語言趨同,而是對人類思維與表達自主權的喪失。
AI正在入侵我們的潛意識。它正在暗中改寫我們的語言基因,操縱著人類最本能的交流密碼!這場悄無聲息的精神殖民會將人類帶向何方?
細思極恐的是,我們甚至還沒意識到自己正在被改造。語言學家發出緊急警告:必須立即監控AI對人類社會全方位的文化滲透,否則后果不堪設想!