成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

被大V推薦的AI論文,被引量會翻倍?兩位推特博主5年推文背后影響揭秘

人工智能 新聞
來自加州大學圣芭芭拉分校的幾位研究者專門寫了一篇論文。結果顯示,被兩位博主推薦的論文在被引量上是不被推薦的論文的 2 到 3 倍。

經常在 X 平臺(推特)上瀏覽 AI 論文的研究者應該都很熟悉兩位博主:AK (@_akhaliq) 和 Aran Komatsuzaki (@arankomatsuzaki)。他們每天都會精選一些論文進行展示,方便大家重點閱讀。數據顯示,AK 在 X 平臺上的粉絲數已經接近 28 萬,Aran Komatsuzaki 也超過了 8 萬。

一般來說,能夠得到這兩位博主推薦的論文通常質量都相對有保證,后續也能得到更多研究者的關注。但是,二人的影響力到底有多大,被推薦和不被推薦的論文在后續的影響力上是否會拉開差距一直很難說清。

為了研究這些問題,來自加州大學圣芭芭拉分校的幾位研究者專門寫了一篇論文。結果顯示,被兩位博主推薦的論文在被引量上是不被推薦的論文的 2 到 3 倍。


  • 論文標題:Tweets to Citations: Unveiling the Impact of Social Media Influencers on AI Research Visibility
  • 論文鏈接:https://arxiv.org/pdf/2401.13782.pdf

具體來說,他們編制了一個包含 8000 多篇論文的綜合數據集。這些論文涵蓋了兩位博主從 2018 年 12 月到 2023 年 10 月期間的推文,并伴有基于發表年份、發表地點和摘要主題的 1:1 匹配對照組。分析結果顯示,得到二人推薦的論文,其引用次數顯著增加,中位數引用次數是對照組的 2 到 3 倍。這樣的結果引發了社區的一些擔憂,有人認為這代表學術界正在 TikTok 化。

圖片

不過,很多人懷疑,這個數據的因果邏輯可能是反的,因為質量更高的論文往往更容易得到這兩位博主的推薦,后續被引量自然更高。

圖片

對此,論文里其實給出了解決辦法。他們通過精確匹配來選擇對照樣本,使用發表細節和文本嵌入作為論文質量的標記。作者表示,他們驗證了他們的方法能夠成功地控制論文質量,這一點從會議審稿得分的分布相似性中得到了證明。

圖片

被兩位博主推薦的論文與未被推薦的論文 OpenReview 平均得分,來自 6 個主要的機器學習會議。圖中結果表明兩組論文的質量大致相當。

對于這個結果,也有人心態比較樂觀,表示數學領域也有類似現象,比如陶哲軒等數學家偶爾也會在網上推薦一些研究。

圖片

但有人反駁說,AI 和數學領域的情況完全不同。一方面,AI 領域涉及大量資金投入和經濟利益,這可能影響到博主推薦內容的客觀性和公正性。另一方面,博主在挑選論文時可能更容易關注到大實驗室的論文,這對一些小實驗室來說可能不太公平。

圖片

在觀察到這些潛在影響后,論文作者呼吁研究社區構建更加負責任的論文傳播方式,這些方式應該盡量展示多樣化的研究主題、作者和機構,營造一種更公平的環境。

以下是論文細節。

數據收集

該研究將具有相同基礎協變量的實驗組和對照組進行比較,以確定平均效果,并假設論文的被引量受時間、質量和主題的影響最大。雖然所用時間很容易測量,但論文質量和主題卻很難量化。

該研究使用論文標題和摘要的文本嵌入來近似化論文主題,整個數據收集過程由三個部分組成:

(1)收集目標集,即推特博主 @_akhaliq 和 @arankomatsuzaki 在推特上分享的論文;

(2)收集要匹配的潛在論文的大型數據集;

(3)通過將 (1) 中的論文與 (2) 中的論文在發表年份、發表地點以及標題和摘要的文本嵌入方面進行匹配來設置控制集。

圖片

分析

該研究將推特博主 AK 和 Komatsuzaki 分享的論文與控制集的影響進行了比較,然后根據所選論文的地理分布和作者屬性進行多變量分析。

該研究采用對比分析方法測試了以下假設:

博主分享的論文與同一領域的其他論文具有相同的被引量。 

博主分享的論文比同一領域的其他論文具有更高的被引量。

該研究比較了配對的目標集和控制集,發現 AK 分享的論文的被引量中位數為 24 (95% CI: 23, 25),而對照組為 14(95% CI: 13, 15);Komatsuzaki 分享的論文被引量中位數為 31 次(95% CI:27、34),而對照組為 12 次(95% CI:10.5、13.5)。與相應的控制集相比,兩個實驗集分布都偏向于更高的被引量,如下圖 3 所示。

圖片

如圖 3 (c)(d) 所示,與對照組相比,博主分享論文分布中的三個四分位數和最大值均較高。

在 2 - 樣本 Q-Q 圖(圖 4)中,我們可以看到測試分布的歸一化分位數始終較高。每個成對樣本的 Cliff’s Delta 值進一步強化了 Q-Q 結果,如表 3 所示。

圖片

圖片

表 3 的數據說明博主分享論文實際上對改變結果變量(即論文的被引量)具有重要意義。

最后,該研究通過三個測試建立統計顯著性,將實驗數據的分布與控制集 Epps-Singleton (ES)、Kolmogorov-Smirnov (KS) 和 Mann-Whitney U (MWU) 的分布進行比較。如表 3 所示,所有結果的 p 值都遠低于 α = 0.001。由此,該研究可以有力推翻原假設:博主分享的論文和對照組的引用分布相同。

總體而言,有影響力的推文和被引量之間的相關性表明機器學習社區查找和閱讀論文的方式發生了變化。傳統上,頂級會議接受度(即評審分數)一直是未來被引量的主要指標,但該研究表明,影響力大的博主分享論文已成為影響被引量的重要指標。

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2012-08-20 09:41:05

開源技術推特

2024-01-05 15:10:29

2021-07-08 10:13:04

AI 數據人工智能

2020-07-20 14:05:11

數據庫安全技術

2023-05-17 10:05:58

馬斯克推特

2022-11-29 14:23:08

2025-05-29 10:32:32

2012-05-08 09:44:58

iOSTwitPic

2020-10-26 14:11:13

特朗普漏洞推特密碼

2015-03-16 10:26:59

2023-03-04 22:01:01

ChatGPTAI

2015-06-15 13:06:23

項目項目經驗

2023-07-07 07:57:52

2012-12-07 10:51:58

2025-04-03 09:45:51

2023-03-28 16:22:42

代碼曝光

2013-07-01 18:34:47

個推案例新浪微博

2021-07-13 08:09:34

微博推特評論

2023-07-03 09:49:57

推特馬斯克

2022-04-26 10:41:33

馬斯克推特
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕第十页 | 日韩欧美精品一区 | 天天干天天想 | 在线区 | 国产精品久久一区二区三区 | h视频免费在线观看 | 国产日韩欧美在线观看 | 中文字幕亚洲欧美日韩在线不卡 | 精品日韩一区二区 | 久久久久久国产精品免费免费狐狸 | 欧美一区二区三区在线看 | 九九九视频 | 国产免费一区二区 | 精品一区在线看 | 亚州成人 | 久久99精品久久久久久 | 亚洲综合在 | 无毛av | 亚洲精品在线视频 | 欧美一区二区三区在线看 | 久久最新 | 亚洲品质自拍视频网站 | 特级做a爰片毛片免费看108 | 亚洲在线一区 | 日韩成人免费中文字幕 | 另类在线| 国产精品18hdxxxⅹ在线 | 亚洲精品视频网站在线观看 | 成人午夜电影网 | 成人免费观看男女羞羞视频 | av网站免费| 91成人免费电影 | 岛国毛片在线观看 | 久久福利 | 成人国产在线视频 | 成人在线视频网 | 国产一级精品毛片 | eeuss国产一区二区三区四区 | 在线视频 亚洲 | 一级看片免费视频囗交动图 | 成人超碰|