成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

陳丹琦等人組織的COLM獎項公布:被ICLR拒稿的Mamba入選杰出論文

人工智能 新聞
會議組織者都是 NLP 頭部科學家,在語言建模方面有著相當的成果。

隨著 AI 領域的快速發展,大模型逐漸成為研究的核心,為了更好地探索這一領域,2023 年,一批知名的青年學者組織了一個名為 COLM(Conference on Language Modeling)的新會議。

該會議的組織者們都是 NLP 頭部科學家,在語言建模方面有著相當的成果。他們其中既有來自業界的研究人員,也有來自學術界的研究人員。

在今年的組織者中,有我們熟悉的陳丹琦、Angela Fan 等華人學者。

COLM 是一個專注于語言建模研究的學術場所,旨在創建一個具有不同科學專業知識的研究人員社區,專注于理解、改進和評論語言模型技術的發展。這不僅是學術界的一次創新嘗試,也是搭起了語言模型交流互鑒的新橋梁,進一步促進其探索和合作。

圖片

接收論文鏈接:https://colmweb.org/AcceptedPapers.html

剛剛,大會公布了 2024 年杰出論文獎,共有 4 篇論文獲獎。

值得一提的是,號稱撼動 Transformer 統治地位的 Mamba 也在獲獎論文中。

此前,Mamba 這項研究慘遭 ICLR 拒稿,引來學術界軒然大波。

不過,之后 Mamba 原班人馬發布的 Mamba-2 順利拿下了 ICML 2024。如今 Mamba 又獲得了 COLM 杰出論文獎,很多網友都送來祝賀。

圖片Mamba 作者之一、卡內基梅隆大學機器學習系助理教授 Albert Gu 用一張表情很好的表達了自己的感受,看來「COLM 是真香」。

圖片

杰出論文獎

論文 1:Dated Data: Tracing Knowledge Cutoffs in Large Language Models

  • 機構:霍普金斯大學
  • 作者:Jeffrey Cheng、Marc Marone、Orion Weller、Dawn Lawrie等
  • 論文地址:https://openreview.net/pdf?id=wS7PxDjy6m

圖片

大型語言模型 (LLM) 通常有「知識截止日期」,即收集訓練數據的時間。該信息對于需要 LLM 提供最新信息的應用場景至關重要。

然而,訓練數據中所有子資源是否共享相同的「知識截止日期」?模型響應展示出的知識是否與數據截止值一致?

圖片

該論文定義了「有效截止」的概念,它與 LLM 報告的「知識截止日期」不同,并且訓練數據子資源之間也有所不同。該研究提出了一種簡單的方法,通過跨版本的數據探測來估計 LLM 在資源級別的有效截止點。至關重要的是,該方法不需要訪問模型的預訓練數據。

通過分析,該研究發現有效的截止值通常與報告的截止值有很大不同。為了了解這一觀察結果的根本原因,該研究對開放的預訓練數據集進行了大規模分析。

圖片

分析揭示了造成這些不一致的兩個主要原因:

  • 由于新 dump 中存在大量舊數據,導致 CommonCrawl 數據出現時間錯位; 
  • LLM 重復數據刪除方案的復雜性涉及語義重復和詞匯近似重復。

論文 2:Mamba: Linear-Time Sequence Modeling with Selective State Spaces

  • 機構:卡內基梅隆大學、普林斯頓大學
  • 作者:Albert Gu、Tri Dao
  • 論文地址:https://arxiv.org/pdf/2312.00752

圖片

自 2017 年被提出以來,Transformer 已經成為 AI 大模型的主流架構,但隨著模型規模擴大和處理序列變長,其計算效率問題凸顯,特別是在長上下文中,計算量將呈平方級增長。

為解決這一問題,研究者們圍繞注意力開發了多種變體,如線性注意力、門控卷積、循環模型、SSMs 等,但它們在語言等模態上的表現并不理想,無法進行基于內容的推理。

基于此,論文作者進行了幾項改進。首先,讓 SSM 參數成為輸入的函數,解決了離散模態的弱點,使模型能根據當前 token 有選擇地傳播或遺忘信息。

圖片

這種改動導致卷積效率降低,對模型的計算帶來了挑戰。論文作者設計了一種硬件感知算法,將先前的 SSM 架構設計與 Transformer 的 MLP 塊合并為一個塊,簡化了深度序列模型架構,形成了一種包含選擇性狀態空間的簡單、同質的架構設計(Mamba)。

圖片

Mamba 可以隨上下文長度的增加實現線性擴展,其性能在實際數據中可提高到百萬 token 長度序列,并實現 5 倍的推理吞吐量提升。

作為通用序列模型的骨干,Mamba 在語言、音頻和基因組學等多種模態中都達到了 SOTA 性能。在語言建模方面,無論是預訓練還是下游評估,他們的 Mamba-3B 模型都優于同等規模的 Transformer 模型,并能與兩倍于其規模的 Transformer 模型相媲美。

更多詳情,可以參考機器之心之前的報道:五倍吞吐量,性能全面包圍 Transformer:新架構 Mamba 引爆 AI 圈。

論文 3:AI-generated text boundary detection with RoFT

  • 機構:俄羅斯 AI 基金會與算法實驗室、英國倫敦瑪麗女王大學、日本 Noeon 研究所、斯科爾科沃科學技術學院等
  • 作者:Laida Kushnareva, Tatiana Gaintseva, Dmitry Abulkhanov等
  • 論文地址:https://arxiv.org/pdf/2311.08349

圖片

隨著大語言模型的發展,我們越來越頻繁地遇到這樣的情況:一篇文章起初可能出自人類之手,但隨后可能被 AI 接手加以潤色。如何從這種文本中檢測出人類寫作與機器生成的界限?這是一個具有挑戰性的問題,但還尚未得到太多關注。

論文作者試圖填補這一空白。他們對最先進的檢測方法進行了測試。具體而言,他們采用「真假文本」測試集,測試了在極限情況下,這些方法的表現。「真假文本」測試集包含各種語言模型生成的多個主題的短文本。

圖片

他們發現,基于困惑度的邊界檢測方法,在處理特定領域的數據時,比對 RoBERTa 模型進行監督式的方法更加魯棒。他們還發現了一些特定的文本特征。這些特征可能會干擾邊界檢測算法的判斷,導致算法在處理跨領域的文本時,其性能會下降。

論文 4:Auxiliary task demands mask the capabilities of smaller language models

  • 機構:哈佛大學、斯坦福大學
  • 作者:Jennifer Hu、Michael Frank
  • 論文地址:https://openreview.net/forum?id=U5BUzSn4tD#discussion

圖片

發展心理學家一直在爭論語言理解或心理理論等認知能力何時出現。這些爭論通常取決于「任務要求」的概念 —— 與執行特定評估相關的挑戰。在衡量語言模型 (LM) 的能力時,任務的性能是模型基礎知識的函數,再加上模型在給定可用資源的情況下解釋和執行任務的能力。

圖片

該研究表明,對于類比推理、反思推理、單詞預測和語法判斷,任務要求較高的評估方法比要求減少的評估方法產生的性能更低。對于參數較少和訓練數據較少的模型,這種「需求差距」最為明顯。實驗結果表明,LM 的性能不應被解釋為智能(或缺乏智能)的直接表現,而應被解釋為通過研究人員設計選擇的視角所看到的能力反映。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-26 07:40:00

研究論文

2023-12-17 13:02:10

AI模型

2022-07-26 09:56:48

模型AI

2023-08-24 14:10:37

AI論文

2024-01-17 12:05:12

AI模型

2024-01-26 12:51:33

AI

2024-03-12 13:14:58

模型訓練

2023-10-12 12:13:16

AI訓練

2022-02-17 14:52:10

模型AI谷歌

2024-01-26 15:28:29

大模型MambaLeCun

2025-06-25 09:15:38

AI模型LLM

2024-01-26 12:48:49

AI數據

2023-03-23 18:46:19

論文

2024-02-19 13:10:02

AI模型

2023-10-05 12:28:41

AI論文

2024-05-08 09:37:36

AI論文

2021-08-25 16:53:32

技術研發論文

2021-07-19 15:02:48

機器人人工智能算法

2025-04-15 04:00:00

ICLRClaudeSpotlight

2023-03-04 21:57:26

蘋果學者
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品在线视频 | 亚洲精品免费在线 | 欧美一区二区免费在线 | 国产精彩视频一区 | 国产伦精品一区二区三区四区视频 | 韩国av电影网 | 欧美影院| 中国大陆高清aⅴ毛片 | 成人免费观看网站 | 国产成人99久久亚洲综合精品 | 日韩欧美大片在线观看 | 亚洲高清免费观看 | 国产精品久久久亚洲 | 欧美一区二区免费 | 国产精品日韩高清伦字幕搜索 | 在线观看国产精品视频 | 久久一久久 | 亚洲v日韩v综合v精品v | 日韩视频一区在线观看 | 亚洲高清在线播放 | 激情亚洲 | 久久久精品网 | 亚洲精品乱码久久久久久久久久 | 午夜精品 | 欧美日韩在线免费观看 | 国内毛片毛片毛片毛片 | 中文字幕亚洲区 | 日韩欧美一区在线 | 男女羞羞视频大全 | 极品粉嫩国产48尤物在线播放 | 午夜小视频在线观看 | 九色.com | 国产大学生情侣呻吟视频 | 三区在线 | 三级黄色片在线 | 天天躁日日躁狠狠躁2018小说 | 免费国产视频在线观看 | 亚洲五码在线 | 凹凸日日摸日日碰夜夜 | 欧美激情精品久久久久久变态 | 成人伊人网 |