成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用上AI,升職提前4年?清華等分析6790萬篇論文:科學(xué)界收縮,不用AI的領(lǐng)域無人問津

人工智能 新聞
AI真是助力科研的神器,不光能用大模型提升寫作效率,跟AI技術(shù)沾邊的論文中頂刊的概率也會增加,升職速度也會提升;但對于科學(xué)界來說,大家都一股腦去研究AI,那些不能用AI的領(lǐng)域受到了冷落,最終導(dǎo)致整體科研多樣性下降。

ChatGPT發(fā)布以來,各種大模型層出不窮,對各行各業(yè)的文字、腦力工作者來說絕對是一個效率神器,產(chǎn)出量大大提升。

比如最近的研究成果,清華大學(xué)、芝加哥大學(xué)、Google的研究人員利用AI工具(模型性能F1值為0.876)分析了六大主要學(xué)科的6790萬篇研究論文,結(jié)果發(fā)現(xiàn),采用AI工具的科學(xué)家發(fā)表的論文數(shù)量增加了67.37%,獲得的引用次數(shù)是未使用AI工具的科學(xué)家的3.16倍,并且還能提前4年成為團隊領(lǐng)導(dǎo)者。

圖片

論文鏈接:https://arxiv.org/pdf/2412.07727

但凡事都有代價。

一旦打開「AI模型」的潘多拉魔盒,就代表研究人員不再廣泛探索科學(xué)領(lǐng)域,而是專注于某個細小的課題,利用AI模型發(fā)表的論文大多都是在已有的、數(shù)據(jù)豐富的領(lǐng)域。

也就是說,大模型不會幫助科研人員創(chuàng)立一個新領(lǐng)域,雖然提高了個人的科研生產(chǎn)力,但卻極大減少了整個科研集體的多樣性和廣泛參與度。

44年,6800萬篇論文

AI工具與知識生產(chǎn)緊密相連,比如AlphaFold通過學(xué)習(xí)已知的蛋白質(zhì)結(jié)構(gòu)來準確預(yù)測尚未探索的結(jié)構(gòu),避免了傳統(tǒng)結(jié)構(gòu)推斷中的資源消耗和人力成本,并因此獲得了2024年諾貝爾獎。

通過深度強化學(xué)習(xí)改進的模型已經(jīng)能夠處理復(fù)雜的核聚變反應(yīng),并發(fā)現(xiàn)了新的、針對硬件優(yōu)化的矩陣乘法形式,從而加速了深度學(xué)習(xí)本身的發(fā)展。

此外,大型語言模型可以非常出色地幫助科研人員修訂和提煉論文寫作,促進了發(fā)現(xiàn)結(jié)果的提煉和傳播。

盡管在科研領(lǐng)域中,AI模型的參與度越來越高,但業(yè)界仍然沒有對AI科學(xué)影響的大規(guī)模實證評估。

所以這篇論文的研究團隊主要提出并回答一個問題:個體科研人員基于自身利益選擇AI模型進行輔助,對整個科學(xué)界有何影響?

研究人員進行了一項大規(guī)模的定量分析,利用OpenAlex數(shù)據(jù)集中從1980年到2024年的1.09億篇論文,選擇其中六個學(xué)科(生物學(xué)、醫(yī)學(xué)、化學(xué)、物理學(xué)、材料科學(xué)和地質(zhì)學(xué)),涵蓋了主要的自然科學(xué)學(xué)科,并特意排除掉計算機科學(xué)和工程學(xué),以避免混入AI相關(guān)從業(yè)者的影響,最終得到約6800萬篇論文。

然后利用BERT語言模型根據(jù)「標題」和「摘要」內(nèi)容區(qū)分出論文中用到的技術(shù)是機器學(xué)習(xí)、某個深度學(xué)習(xí)架構(gòu),或者是基于Transformer的大模型。

研究人員采用兩階段的微調(diào)將預(yù)訓(xùn)練的BERT模型適應(yīng)到論文識別任務(wù):先分別基于論文的標題和摘要獨立訓(xùn)練兩個模型,再將兩個優(yōu)化后的個體模型集成起來,以識別所有選定的論文,無需人工選擇與AI相關(guān)的觸發(fā)詞。

圖片

為了評估BERT模型識別的準確性,研究人員招募了一個專家團隊來驗證結(jié)果,在對六個重點學(xué)科中隨機抽樣的論文組進行獨立標注時共識很高,平均Fleiss' Kappa值為0.960,把專家標注數(shù)據(jù)當作金標準進行評估時,得到的F1分數(shù)為0.876,證明了模型的可靠性。

為了提高識別結(jié)果的可解釋性,研究人員對輸入標題和摘要時BERT模型最終層的平均注意力強度進行可視化,比如在分析一篇AI輔助的化學(xué)論文時,模型對「人工智能」和「深度神經(jīng)網(wǎng)絡(luò)」等術(shù)語分配了非常高的注意力權(quán)重,并且識別出的AI論文基本上都是「人工智能」和跨學(xué)科傳統(tǒng)研究主題的結(jié)合,說明了模型如何正確解釋并準確識別與AI相關(guān)的內(nèi)容。

最終識別出107萬篇AI輔助論文,大約占論文總數(shù)的1.57%,并且可以觀察到所有學(xué)科采納AI的趨勢都在上升,AI論文和采納AI的研究人員比例都有顯著增加。

盡管各個學(xué)科每年發(fā)表的論文數(shù)量總體上升,但從1980年到2024年,AI論文的份額在地質(zhì)學(xué)中增長了21.39倍,在材料科學(xué)中增長了241.36倍;同樣,采納AI的研究人員比例增長得更快,從地質(zhì)學(xué)的42.36倍增長到物理學(xué)的307.40倍。

研究人員將過去幾十年的AI發(fā)展劃分為機器學(xué)習(xí)(ML)、深度學(xué)習(xí)(DL)和大型語言模型(LLM)時代,三個時代的增長率逐漸加快,可以看出AI在科學(xué)中的普及率不斷提高,以及理解AI對科學(xué)研究和進步影響的重要性。

AI是職業(yè)生涯加速器

從引用統(tǒng)計數(shù)據(jù)中,研究人員注意到,從發(fā)表日期到幾十年后,人工智能(AI)論文的年引用次數(shù)持續(xù)高于非AI論文,并且不同時期發(fā)表的AI論文受到的總引用次數(shù)也更高。

此外,研究人員還檢查了AI輔助論文在不同期刊引用報告(JCR)分位數(shù)中的分布,結(jié)果發(fā)現(xiàn),在Q1期刊中,AI論文的比例比所有期刊中的非AI論文高出18.60%;在Q2期刊中,AI論文的比例僅高出1.59%,而Q3和Q4期刊中包含AI的論文比例相對較低。

結(jié)果表明,AI輔助論文在期刊中的分布不均,且在高影響力期刊中更為普遍。

AI論文逐漸受到重視,AI研究人員的影響力也大幅增加,平均來看,采用AI的研究人員每年發(fā)表的論文數(shù)量比不使用AI的研究人員多出67.37%,獲得的引用次數(shù)則是后者的3.16倍,這一趨勢在各個學(xué)科中都有體現(xiàn)。

圖片

為了研究采用AI對職業(yè)發(fā)展的影響,文中將科研人員分為「初級」(尚未領(lǐng)導(dǎo)研究團隊)和「資深」(已經(jīng)領(lǐng)導(dǎo)過團隊)兩類,并從數(shù)據(jù)集中提取了351萬條職業(yè)軌跡。

分析顯示,AI研究會導(dǎo)致團隊規(guī)模的縮小,平均每個研究團隊少了1.5名科研人員,具體來說,初級科研人員的平均人數(shù)從非AI團隊的2.31人減少到AI團隊的1.47人(減少了36.45%),而資深科研人員的人數(shù)從4.14人減少到3.48人(減少了15.95%)。

在所有學(xué)科中,采用AI的初級科學(xué)家轉(zhuǎn)變?yōu)橘Y深科學(xué)家的概率為49.92%,比不采用AI的同行高出32.01%,表明AI為初級科學(xué)家提供了更多領(lǐng)導(dǎo)研究團隊的機會,并降低了離開學(xué)術(shù)界的概率,從而促使了他們從初級到資深科學(xué)家的職業(yè)轉(zhuǎn)變。

為了進一步量化這一效應(yīng),研究人員采用生死模型,并根據(jù)科學(xué)家的職業(yè)軌跡擬合模型參數(shù)λ,結(jié)果發(fā)現(xiàn),采用AI的初級科學(xué)家成為資深科學(xué)家的預(yù)期時間比同行大約縮短了四年;采用AI的初級科學(xué)家的轉(zhuǎn)變時間期望值為6.84年,而不采用AI的為10.90年。

進一步分析顯示,這種縮短升職時間的現(xiàn)象在所有學(xué)科中都是普遍存在的,并且在各個學(xué)科中,參與AI論文的資深科學(xué)家平均年齡比非AI論文的資深科學(xué)家年輕。

科學(xué)探索范圍收縮

隨著人工智能(AI)在科學(xué)中的加速應(yīng)用,以及它在推動初級科學(xué)家成為資深科學(xué)家方面的作用,人們開始關(guān)注AI對整個科學(xué)領(lǐng)域知識分布的潛在影響。

為了評估AI如何影響整個科學(xué)領(lǐng)域研究的前沿,研究人員設(shè)計了一種測量方法來描述一組研究論文所代表的「學(xué)術(shù)關(guān)注廣度」。

圖片

具體來說,先使用在大量科學(xué)文獻預(yù)訓(xùn)練的文本嵌入模型SPECTER 2.0,在給定每個領(lǐng)域中同樣大小的樣本量來計算代表AI和非AI論文的主題覆蓋范圍;與傳統(tǒng)研究相比,AI研究使整個科學(xué)的集體知識廣度縮小了4.96%,并且該效應(yīng)在六個學(xué)科中都是一致的。

此外,當將學(xué)科細分為200多個子領(lǐng)域時,可以觀察到超過70%的子領(lǐng)域的知識廣度出現(xiàn)了收縮;當比較AI和非AI研究在每個領(lǐng)域知識分布的熵時,結(jié)果表明AI研究的知識分布熵明顯更低,表明人們越來越關(guān)注特定問題,而不是整個領(lǐng)域。

也就是說,個體和集體之間采用AI的動機存在沖突和矛盾:科研人員獲得了更多的個人影響力,但整個科學(xué)領(lǐng)域知識的范圍卻縮小了,只是將注意力集中在最適合AI研究的領(lǐng)域,例如那些數(shù)據(jù)豐富的領(lǐng)域。

盡管AI可能為科學(xué)家個人帶來了好處,但可能也會使科學(xué)作為一個整體的探索范圍變得更加狹窄。

AI研究一窩蜂,創(chuàng)新冗余

為了分析AI研究中個體論文和研究者影響力增長與領(lǐng)域知識范圍縮小之間的沖突背后的機制,研究人員考察了引用AI輔助和非AI工作的論文之間的關(guān)系。

首先檢查單個論文的「引用家族」(citation families)的知識空間特征,即一篇原創(chuàng)論文及其所有后續(xù)引用,結(jié)果顯示,與非AI論文相比,單個AI論文的引用家族的知識空間更為多樣性,因此,領(lǐng)域知識空間的縮小并不是由于在AI與非AI研究基礎(chǔ)上構(gòu)建的論文范圍的縮小所致。

圖片

之后,研究人員通過測量后續(xù)論文參與度的程度來考察論文之間的關(guān)系,即同一原創(chuàng)論文的引用之間相互引用的頻率,結(jié)果表明,AI研究產(chǎn)生的后續(xù)參與度比非AI研究少了24.40%,表明AI論文更傾向于擴展原創(chuàng)論文,而不是在彼此之間形成互動,而互動恰恰是促進新興領(lǐng)域的關(guān)鍵要素。

在不同領(lǐng)域中AI論文引用的馬太效應(yīng)中也發(fā)現(xiàn)了這種集中的進一步證據(jù):在AI研究中,少數(shù)超級明星論文主導(dǎo)了該領(lǐng)域,大約20%的頂級論文獲得了80%的引用,50%的論文獲得了95%的引用,這種不平等的分布導(dǎo)致了AI研究引用模式的基尼系數(shù)為0.753,高于非AI論文的0.684,表明認可度的不平等正在增加。

最后,研究人員還檢查了引用同一原始工作的論文對在向量空間中的距離,區(qū)分出相互引用的論文,結(jié)果發(fā)現(xiàn),科學(xué)界的AI更加集中于特定的熱門話題,導(dǎo)致了更多的重復(fù)想法和冗余創(chuàng)新,與科學(xué)知識范圍和多樣性的縮小有關(guān)。

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2021-06-04 17:57:04

微信微信圈子騰訊

2010-12-07 11:05:03

Cisco SysteNetflow v9

2020-11-15 23:43:16

軟件定義電源虛擬化電源系統(tǒng)

2009-03-06 18:58:23

AndroidWindows Mob

2017-03-10 09:32:45

谷歌KaggleAI

2020-06-13 16:13:03

Windows 10應(yīng)用商店微軟

2020-05-14 09:53:32

Windows 10Win 10商店微軟

2019-12-16 14:15:37

Spark數(shù)據(jù)科學(xué)Hadoop

2013-12-04 10:00:56

PythonR語言數(shù)據(jù)科學(xué)家

2025-05-28 00:30:00

MCP智能體Agent

2018-02-08 07:28:31

2025-01-21 09:30:00

AI科學(xué)技術(shù)

2021-03-02 14:33:57

Intel處理器超頻

2020-12-28 09:26:02

人工智能

2014-12-22 09:45:41

好軟件

2023-03-26 21:03:54

GPT-4人工智能

2019-12-25 14:00:26

數(shù)據(jù)科學(xué)人工智能科學(xué)家

2022-07-28 19:31:39

AlphabetDeepMind擴展數(shù)據(jù)庫

2021-04-12 11:41:09

人工智能知識圖譜

2025-01-16 15:00:00

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产亚洲网站 | 久久国产欧美一区二区三区精品 | 久久一区视频 | 日韩视频免费看 | 免费在线看a | 精品久久久久久久久久久久 | 欧美日韩成人一区二区 | 精品国产一区二区三区久久久四川 | 久久亚洲欧美日韩精品专区 | 北条麻妃视频在线观看 | 亚洲精品日韩精品 | 亚洲国产欧美在线 | 国产乱码精品一区二区三区中文 | 在线视频 亚洲 | 久久亚洲综合 | 一区二区影院 | 午夜影院免费体验区 | 国产精品久久久久久久久免费高清 | 精品久久一 | 免费一区二区 | 欧美日韩国产一区二区三区 | 亚洲视频中文字幕 | 国产精久久久久久 | 精品视频www | 国产成人在线视频播放 | 亚洲xx在线 | 91看片官网 | a国产一区二区免费入口 | 91精品国产91久久久久游泳池 | 日韩一区二区三区精品 | 久久av一区二区三区 | 国产精品一二三区在线观看 | 免费中文字幕 | 超级黄色一级片 | 日韩中文视频 | 色视频网站在线观看 | 亚洲国产一区二区三区在线观看 | 91久久久久久久久久久久久 | 国产成人av电影 | 欧美成人精品激情在线观看 | 久久久久久成人网 |