成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型指令調優數據集萬字評測!騰訊上交大聯合出品

人工智能 新聞
騰訊優圖實驗室發布一篇完整綜述進行梳理。長度超過了萬字,涉及的文獻多達400余篇。

一口氣生成2萬字,大模型輸出也卷起來了!

清華&智譜AI最新研究,成功讓GLM-4、Llama-3.1輸出長度都暴增。

相同問題下,輸出結果直接從1800字增加到7800字,翻4倍

圖片

要知道,目前大模型的生成長度普遍在2k以下。這對于內容創作、問題回答等都存在影響,可能導致模型回答問題不全面、創造性降低等。

該研究由智譜AI創始人、清華大學教授李涓子和唐杰共同領銜。

圖片

論文及代碼都已放在GitHub上開源。

有網友已經搶先體驗。LongWriter-llama3.1-8b可生成萬字長文《羅馬帝國衰落史》,在MacBook Pro 2018(32GB)上就能運行。

輸出內容很準確,可以得A++。

圖片

9B模型搞定萬字輸出

本項研究主要包括3方面工作。

  • 分析文本生成長度限制因素
  • 提出AgentWrite
  • 擴展LLM輸出窗口大小

首先,研究人員構建了一個測試工具LongWrite-Ruler。通過測試多個大模型,他們發現所有模型在生成超過2000字的文本時都遇到了困難。

進一步分析用戶和大模型的交互日志,研究人員發現只有超過1%的用戶請求明確提到要生成超過2000字的文本。

為此,他們改變了模型在監督式微調(SFT)階段使用的數據集的最大輸出長度

結果發現,模型的最大輸出長度與SFT數據集中的最大輸出長度呈顯著正相關

所以得出結論,現有模型在輸出長度上受限主要是因為SFT數據集中缺少長輸出樣本

即使模型在預訓練階段見過更長的序列,但是SFT階段缺乏長文本樣本,還是會影響輸出長度。

圖片

為了克服這個限制,研究人員提出了AgentWrite

這是一個基于Agent的pipline。

圖片

它允許將超長文本生成任務分解為多個子任務,每個子任務處理其中的一段。

具體流程是AgentWrite先根據用戶指令制定出一個詳細的寫作計劃,計劃包括每個段落的主要內容點和目標詞數。根據計劃,AgentWrite依次提示模型生成每個段落的內容。

圖片

在AgentWrite基礎上,團隊利用GPT-4o生成了6000個長輸出SFT數據,輸出長度在2k到32k詞之間,構成了數據集LongWriter-6k。并將這些數據添加到訓練過程中。

為了驗證方法的有效性,團隊還提出了一個LongBench-Write。其中包含了多樣化的用戶寫作指令,輸出長度規格分別為0-500詞、500-2000詞、2000-4000詞以及4000詞以上。

評估結果顯示,使用AgentWrite后模型輸出長度明顯增加。

圖片

通過直接偏好優化(DPO),GLM-4-9B在一眾模型中實現了最佳性能。

圖片

手速快的網友已經搶先實測。

Reddit上一位網友讓LongWriter-llama3.1-8b生成羅馬帝國衰敗史,整體需要22分鐘(與硬件有關),平均每秒生成3.34個token。

圖片

生成內容比較公式化,回答不同問題的結構、節奏相似。

無論如何這是個好的開始,帶來的提升很明顯。

圖片

研究團隊也表示未來將進一步擴展模型的輸出長度和輸出質量,同時也會開始研究如何在不犧牲生成質量的情況下提高效率。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-12-02 10:40:00

AI模型

2024-08-02 14:50:00

數據AI

2024-09-29 10:40:00

數據模型

2024-08-12 09:05:00

AI訓練

2024-02-29 12:23:54

AI數據

2024-02-02 21:42:41

2022-07-19 16:03:14

KubernetesLinux

2023-11-13 19:35:12

訓練數據

2025-01-07 13:22:58

2024-01-24 09:39:40

自動駕駛論文

2023-06-13 13:40:00

模型指令

2023-10-31 12:58:00

TypeScriptJavaScript

2021-03-16 08:21:29

Spark系統并行

2023-07-09 14:50:48

模型調優

2024-01-15 08:17:00

模型技術

2025-06-26 02:22:00

2022-11-21 14:43:34

人臉復原SOTA

2021-11-11 09:27:02

技術RedisMySQL

2021-10-18 11:58:56

負載均衡虛擬機
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 婷婷开心激情综合五月天 | 日韩视频一区在线观看 | 精品国产31久久久久久 | 美女逼网站 | 黄色小视频入口 | 羞羞的视频在线观看 | 一区二区三区免费 | 一区二区三区日本 | 中文字幕一区二区三区日韩精品 | 国产成人免费视频网站高清观看视频 | 久久性av| 国产高清在线 | 精品福利视频一区二区三区 | av在线免费观看网站 | 日本a∨精品中文字幕在线 亚洲91视频 | 久久国内精品 | 国产成人精品免费视频 | 久久久久久网 | 日本一区二区三区四区 | 久久在线| 一区二区三区亚洲精品国 | 亚洲精品一区二区网址 | 国产一在线 | 国产精品欧美一区二区 | 91精品国产欧美一区二区成人 | 日韩欧美国产综合 | 国产免费一区二区三区 | jlzzjlzz国产精品久久 | 日韩欧美在线观看视频 | 久久精品欧美电影 | 久久最新精品 | 国产亚洲网站 | 一区二区在线不卡 | 亚洲一区二区免费视频 | 九九热精品视频 | 欧美中文一区 | 久久中文一区二区 | 久久精品国产一区二区电影 | 亚洲成人黄色 | 色吊丝2288sds中文字幕 | 日日做夜夜爽毛片麻豆 |