成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<dl id="eeq8c"></dl>

<dl id="eeq8c"><acronym id="eeq8c"></acronym></dl>

<tfoot id="eeq8c"></tfoot>

<li id="eeq8c"><source id="eeq8c"></source></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

兩行代碼，「三體」一次讀完！港中文賈佳亞團隊聯手MIT發布超長文本擴展技術，打破LLM遺忘魔咒

作者：新智元 2023-10-09 14:17:00

人工智能新聞

大模型上下文從此不再受限！港中文賈佳亞團隊聯手MIT發布了全新超長文本擴展技術LongLoRA，只需2行代碼，讓LLM看小說，讀論文，輕松拿捏。

中途迷失、模型偷懶、上下文越長大模型越笨……

體驗過LLM的人，多少都會對文本輸入長度帶來的限制有所感觸：

想和大模型討論一些稍長的內容，就需要拆分輸入，而前面輸入的要點，很快就會被大模型忘記。

實際上，這些都是典型的大語言模型對話缺陷。就像先天有注意力缺陷的兒童，難以專注看完一本新書。而缺陷的關鍵，在于模型缺乏長文本處理能力。

如今，這個局面已經被打破了！

就在近日，由賈佳亞團隊聯合MIT發布的新技術和新模型，悄然登上各大開源網站的熱榜：

Hugging Face熱榜第一、Papers With Code熱度第一，Github全部Python項目熱度第五、Github Stars一周內破千，Twitter上的相關技術帖子瀏覽量近18萬......

論文地址：https://arxiv.org/abs/2309.12307

代碼和Demo地址：https://github.com/dvlab-research/LongLoRA

GitHub Stars已達1.3k

Twitter上的相關技術帖子瀏覽量近18萬

這項名為LongLoRA的技術實用但卻簡單得令人驚訝：

只需兩行代碼、一臺8卡A100機器，便可將7B模型的文本長度拓展到100k tokens，70B模型的文本長度拓展到32k tokens。

同時，該研究團隊還發布了首個擁有70B參數量的長文本對話大語言模型LongAlpaca。

全球首個70B長文本大語言模型發布

LongLoRA的提出，讓全球大語言模型的對話缺陷第一次得到解決，自此，幾十頁的論文、幾百頁的報告、鴻篇巨制不再成為大模型盲區。

對此，有專業人士激動地表示，LongLoRA是大語言模型迷宮中的希望之燈！

它代表著業界對長文本大語言模型的重新思考和關注，有效擴展了大語言模型的上下文窗口，允許模型考慮和處理較長的文本序列，是大語言模型的革新性發明。

除了技術革新外，大語言模型處理長文本問題的一大難點還在于缺少公開的長文本對話數據。

為此，研究團隊特意收集了9k條長文本問答語料對，包含針對名著、論文、深度報道甚至財務報表的各類問答。

光會回答長問題還不夠，該團隊又挑選了3k的短問答語料與9K的長問答語料混合訓練，讓長文本大模型同時具備短文本對話能力。這個完整的數據集被稱為LongAlpaca-12k，目前已經開源。

在LongAlpaca-12k數據集基礎上，研究團隊對不同參數大小7B、13B、70B進行了訓練和評測，開源模型包括LongAlpaca-7B、LongAlpaca-13B和LongAlpaca-70B。

看小說、改論文、指點經濟堪稱全能王

話不多說，盲選幾個demo，一起看看應用了LongLoRA技術疊加12K問答語料的大模型LongAlpaca效果。

讓系統新讀一篇論文，并根據ICLR的審查指南，對其提出修改意見，從而提升該論文的接收率：

LongAlpaca的意見是：通過更精確地闡明新穎性，提供更嚴格和更有對比性的實驗結果(包括具體的數據集和指標)、更廣泛的應用和未來發展方向，重點呈現關鍵貢獻和影響，論文被接受的機會將得到提高。

現在，讓系統讀兩篇新的不同的論文，讓LongAlpaca概括ICLR和CVPR兩個會議之間的風格區別：

LongAlpaca總結認為，CVPR論文傾向更具結構性和實驗性的風格，專注于實用性和技術性。而ICLR的論文風格更加靈活，側重關鍵的理論分析和數學推導，而非標準格式。

可以看出，經過訓練的LongAlpaca模型已經可以很輕松地接受新的長篇學術論文，在學術相關問題的回答上相當精準。

接下來，再看看LongAlpaca模型在頗高閱讀和理解門檻的經濟領域的解讀表現。

根據國際貨幣基金組織從2012年到2023年的全球經濟展望的概述合集，對經濟形勢進行逐年總結以及對未來經濟趨勢進行預測：

LongAlpaca告訴我們，2023年全球經濟形勢不明朗，跟2022年相比，增長預計放緩；未來幾年，全球經濟擴張速度偏溫和并將低于預期，而地緣政治緊張、金融市場波動等大的挑戰依然存在，需通過多邊合作和結構性改革小心應對。

此外，LongAlpaca還可以讀新的長篇小說，讀完后對內容進行分析。

下面選取的對比模型是13B參數的LongAlpaca和Llama2，且看各自表現。

名著《西游記》中，為什么孫悟空在大鬧天宮時很厲害，但取經路上卻屢屢受挫？

LongAlpaca給出了5點原因，大概可總結為：「孫悟空的不成熟、強大的對手、力量的限制、敵人的欺騙、最初缺少同伴等因素導致了他在旅途中的失敗。但隨著時間推移，他獲得了智慧、經驗和戰友，使他最終戰勝了最強大的敵人?！?/span>

而Llama2并沒有給出正確答案：「雖然他確實大鬧天宮，但說他代表著不敗的力量并不一定準確。事實上，他最終在西游記中被強大的唐三藏打敗?！?/span>

這一次讓系統新讀一次《三體》，然后問第一部中，葉文潔為什么要聯系外星人，而后期又為什么后悔？

LongAlpaca認為，葉文潔最初接觸外星人是出于理想主義和復仇，但隨著時間的推移，她對人類的看法發生了變化，意識到自己可能給全人類帶來的危險，她的悔恨與日俱增?；卮鸬檬智逦?/strong>

而Llama2的回答則是，「通過與外星人的互動，她希望能更深入地了解宇宙的本質，以及自己在宇宙中的位置。葉文潔逐漸意識到，外星人和他們的技術并不能解決她的問題?！够卮鸹\統，之后開始對小說整體進行評論，答非所問。

從模型給出的答案可發現，一些模型如Llama2[2]可能在預訓練過程中見過相關小說，但如果在提問時進行僅根據小說題目進行短文本提問的話，回答并不理想。

兩個模型的回答對比，高下立見。LongAlpaca改學術論文、點評全球經濟大勢和讀小說，都是一把好手，完勝Llama2。

兩行代碼和三個關鍵結論

Llama2可以說是AI社區內最強大的開源大模型之一，行業位置領先，LongAlpaca居然可以完勝。其背后的LongLoRA技術成功引起網友們的注意，到底是怎么做到的？

原來大語言模型對長文本處理過程中，計算量的主要開銷集中在自注意力機制(self-attention)，其開銷隨著文本長度成平方次地增加。

針對這個問題，研究團隊提出LongLoRA技術，并用分組和偏移的方式來對全局自注意力機制進行模擬。

簡單來說，就是將長文本對應的tokens拆分成不同的組，在每組內部做自注意力計算，而分組的方式在不同注意力頭（attention head）上有所偏移。

這樣的方式既可以大幅度節約計算量，又可以維持全局感受野的傳遞。

而且，這個實現方法也非常簡潔，僅兩行代碼即可完成！

除此之外，LongLoRA還探索了低秩訓練的方式。

原有的低秩訓練方式，如LoRA[5]，無法在文本長度遷移上取得良好的效果。

而LongLoRA在低秩訓練的基礎上，引入嵌入層（Embedding layer和 Normalization layers）進行微調，從而達到可以和全參數微調（Full fine-tune）逼近的效果。

進行不同長度文本擴展和訓練時，LongLoRA、LoRA和全參數微調不同技術的具體效果如何，可以參考三個維度表現：

在Perplexity-困惑度上，原有LoRA方法的性能在不斷惡化，而LongLoRA和全參數微調都能在各種文本長度下維持很好的效果；
在顯存消耗上，相比于全參數微調，LongLoRA和原有LoRA都有大幅度的節省。例如，對于8k長度的模型訓練，相比于全參數微調，LongLoRA將顯存消耗從46.3GB降低到25.6GB。
在訓練時間上，對于64k長度的模型訓練，相比于常規LoRA，LongLoRA將訓練時間從90～100小時左右降低到52.4小時，而全參數微調超過1000小時。

極簡的訓練方法、極少的計算資源和時間消耗，以及極佳的準確性，令LongLoRA大規模推廣成為可能。

目前，相關技術與模型已全部開源，感興趣的用戶們可以自己部署感受。

值得一提的是，這是賈佳亞團隊繼8月9日發布的「可以分割一切」的多模態大模型LISA后的又一力作。

相距不過短短兩個月，不得不說，這研究速度和能力跟LongLoRA一樣驚人。

責任編輯：張燕妮來源：新智元

AI 模型

分享到微信

微信掃碼分享

分享到微博

相關推薦

賈佳亞韓松團隊新作：兩行代碼讓大模型上下文窗口倍增 | GitHub熱榜
賈佳亞韓松聯合團隊提出的這個基于LoRA的全新大模型微調方法，登上了GitHub熱榜。

2023-10-04 10:38:38

模型方法

賈佳亞團隊開源全球首個70B長文本大語言模型，讀論文看小說直接ProMax
最近，香港中文大學賈佳亞團隊聯合MIT宣布了一項新研究，一舉打破如此僵局。

2023-10-09 12:36:08

人工智能數據

賈佳亞團隊聯合Adobe提出GenProp，物體追蹤移除特效樣樣在行
本文搭建了一個通用的框架，把視頻生成模型轉變為編輯模型GenProp，可將一幀的修改傳播到整個視頻。

2025-01-24 14:14:35

模型框架視頻

賈佳亞團隊提出LISA大模型：理解人話「分割一切」，在線可玩
根據發布的論文來看，LISA是一個多模態大模型，它在這次研究中主攻的任務便是推理分割（ReasoningSegmentation）。

2023-08-09 17:38:47

模型 AI

賈佳亞團隊Mini-Gemini登熱榜，代碼、模型、數據全部開源
MiniGemini堪比GPT4+DALLE3王炸組合。

2024-04-15 12:28:00

AI 模型

賈佳亞團隊新作，多模態大模型挑戰超長3小時視頻
據介紹，LLaMAVID只通過一個非常簡單的辦法就達成了如上能力，那就是：把表示每一幀圖像的token數量，壓縮到僅有2個。

2023-12-10 15:05:47

AI 模型

賈佳亞團隊新作：10k數據讓大模型數學能力超GPT-4
如何強化推理能力，一直是大語言模型領域的重要問題之一。

2024-07-08 08:38:00

模型推理

谷歌&MIT何愷明團隊：視覺大模型像LLM一樣高效Scaling，指路連續token+隨機生成順序
谷歌&MIT何愷明團隊聯手，有望打破這一局面，為自回歸文生圖模型的擴展指出一個方向。

2024-10-21 11:15:00

讓AI替碼農卷復雜任務，賈佳亞團隊提出MoTCoder，準確率刷新SOTA
近日，賈佳亞團隊提出MoTCoder（ModuleofThoughtCoder），通過創新的模塊化思維指令微調（MoTInstructionTuning），顯著提升了模型在復雜編程任務中的準確率與可維護性。

2025-04-03 11:16:10

一次讀完半本「三體」！GPT-4最強競品突然升級10萬token，啃論文代碼演示全搞定
GPT432K還沒用上，ChatGPT最強競品已經秒讀「了不起的蓋茨比」了。

2023-05-12 13:45:50

ChatGPT AI

兩行代碼實現Redis消息隊列，簡單易用
Redis列表數據類型非常適合作為消息隊列使用。將新的消息插入到列表尾部，然后從列表頭部取出消息進行處理。該方案簡單易用，并且支持多個消費者并行處理消息。

2023-09-12 14:58:00

Redis

兩行 JS 代碼實現頁面橫向滾動特效
在前端這個無奇不有的世界里，有些網站不是正常垂直滾動的，而是橫向滾動的。

2021-06-18 10:12:09

JS 代碼前端

LLM練出「火眼金睛」，InfiniRetri超長文本一針見血
LLM自身有望在無限長token下檢索信息！無需訓練，在檢索任務「大海撈針」（NeedleinaHaystack）測試中，新方法InfiniRetri讓有效上下文token長度從32K擴展至1000+K，讓7B模型比肩72B模型。

2025-03-17 09:40:00

賈佳亞團隊新基準讓模型只挑錯不做題，GPT-4得分不到50
賈佳亞團隊聯合多家知名高校提出了一種全新的測評方法，讓一些模型立馬現出了原型。

2024-07-18 12:56:29

賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合！讀懂梗圖刷爆榜單，代碼復現數學函數
賈佳亞團隊提出VLM模型MiniGemini，堪比GPT4+DALLE3王炸組合，一上線就刷爆了多模態任務榜單！讀得懂梗圖，做得了學術，用代碼就能復現數學函數圖。

2024-04-15 12:54:39

港中文、MIT、復旦提出首個RNA基石模型
本文中RNAFM模型的出現一定程度上緩解了RNA帶標注數據緊張的現狀，為其他研究者提供了訪問大批量無標簽數據的便捷接口。并且，該模型將以RNA領域基礎模型的身份，為該領域的各種各樣的研究提供強有力的支援與幫助。

2022-07-17 13:07:26

模型開源

超長LLM時代RAG技術價值探索：順序保持檢索增強生成技術(OP-RAG)顯著提高長文本問答應用性能
最近，長文本LLMs的出現允許模型整合更長的文本序列，使RAG變得不那么吸引人。最近的研究表明，長文本LLMs在長文本應用中顯著優于RAG。與現有工作支持長文本LLMs而不是RAG不同，我們認為LLMs中的極長文本上下文會減少對相關信息的關注，導致答案質量的潛在下降。

2024-09-18 08:42:10

突破自動駕駛視頻生成極限：港中文&港科大&華為聯手推出MagicDriveDiT
現在，香港中文大學、香港科技大學和華為聯手向這一長期挑戰發起了沖鋒：推出MagicDriveDiT，重新定義自動駕駛視頻生成的標準。

2024-12-20 09:30:00

模型訓練數據

揭開大模型“偽遺忘”，港理工等團隊：結構不變就是沒忘
來自香港理工大學、卡內基梅隆大學和加州大學圣克魯茲分校的研究團隊通過構建一套表示空間的診斷工具，系統性地區分了“可逆性遺忘”與“災難性不可逆遺忘”，并首次揭示了遺忘現象背后的表示結構變化規律。

2025-06-03 08:44:00

第一次帶后端團隊，真實！
第一次帶團隊做項目對我來說是一次挑戰和提高。從技術層面講讓我以后面對技術選型時能以更高的角度看待問題；從個人角度講這是一次難得的機會讓我負責開發團隊，對接測試團隊、前端團隊、運維團隊等。這對我的溝通交流都是一次鍛煉。

2023-09-11 00:14:46

后端團隊項目

相似話題

機器學習
 2034內容

深度學習
 1699內容

自然語言處理
 110內容

語音識別
 107內容
全部話題

同話題下的熱門內容

VSCode AI 編程必裝！五款DeepSeek集成插件，每款都讓開發效率飆升 ElementPlusX + RuoyiAI：Vue3 首個 AI 開發模板開源了！OpenAI 停工一周，緊急調薪！Meta滅霸式天價挖8名OpenAI大佬！緊急回應：我們被偷家了！與Meta沖突是支線任務！當Gemini CLI遇見n8n：免費擼Google頂級模型的玩法甭提靜態AI了，MIT新框架讓模型具備自學能力 Cursor + MCP：雙劍合璧，解鎖極致編程效率 Grok 4源代碼剛剛泄露！上線倒計時，馬斯克xAI估值破1130億，大模型要變天你的RAG系統安全么？

相關專題更多

HarmonyOS NEXT 高效開發與創新實踐

馭浪者無疆：蛻變新生，以定馭變

2025-06-04 14:38:36

開發者成長學院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內容

微博

QQ

微信

復制鏈接

微信掃碼分享

51CTO業務

媒體
51CTO CIOAge HC3i Techplur
社區
51CTO博客軟考社區鴻蒙開發者社區 AI.x社區
教育
51CTO學堂精培企業培訓 CTO訓練營

51CTO學堂

51CTO學堂企業版

51CTO官微

51CTO

關于我們&條款

關于我們

新聞動態

站點地圖

意見反饋

English

用戶協議

隱私協議

北京市海淀區中關村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業執照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權所有未經許可請勿轉載

營業執照出版物經營許可證

友情鏈接

新浪科技騰訊科技網易科技鳳凰科技驅動科技科技行者 TechWeb 艾瑞網站長之家速途網中國經濟新聞網 IT之家工聯網極客公園 236視頻會議中國IDC圈企業網D1Net 投資界次方元火山引擎

51CTO技術棧公眾號

51CTO技術棧公眾號

業務
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區
51CTO博客鴻蒙開發者社區 AI.x社區

教育
51CTO學堂精培企業培訓 CTO訓練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
成人免费xxxxx在线视频软件|久久精品久久久|亚洲国产精品久久久|天天色天天色|亚洲人成一区|欧美一级欧美三级在线观看

主站蜘蛛池模板：日韩免费高清视频 | 婷婷久久久久 | 日韩av福利在线观看 | www.亚洲精品 | 欧洲一级毛片 | 亚欧午夜 | 欧美视频在线看 | 国产一区二区三区四区三区四 | 国产免费a视频 | 日本一二三区在线观看 | 国产男女猛烈无遮掩视频免费网站 | 精品综合网 | 夜夜摸天天操 | 69av片| 一区二区三区国产在线观看 | 黄色免费观看网站 | 亚洲国产看片 | 国产1区在线 | 亚洲一区免费在线 | 欧美成人一级 | 成年网站在线观看 | 亚洲毛片在线观看 | 欧美精品综合 | 日韩欧美在线免费 | 中文字幕亚洲视频 | 国产在线精品一区二区三区 | 69亚洲精品 | 国产激情一区二区三区 | 日韩一区二区免费视频 | 天堂在线www | 国产一区二区不卡 | 男人的天堂在线视频 | 亚洲精品一区二区 | 日韩欧美视频 | 一区免费观看 | 91精品国产乱码久久久久久久 | 国产精品久久久久永久免费观看 | 欧美日韩不卡合集视频 | 成人毛片视频免费 | 色在线看| 久久国内精品 |