成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越

發布于 2024-7-23 13:19
瀏覽
0收藏

歷史再次重演,Llama 3.1 405B提前泄露了!


現在,基準測試和磁力鏈已經傳得滿天飛了。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

除了最大的405B,Meta這次還升級了5月初發布的8B和70B模型,并將上下文長度全部提升到了128K。


至此,模型版本也正式從Llama 3迭代到了Llama 3.1。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

根據磁力鏈提供的信息,新模型大小為763.48GiB(約820GB)。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

從泄露的「基準測試」可以看出,連8B小模型都很能打,而70B的模型,性能在多項基準上都能趕超GPT-4o了。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

開發者們看到測試結果后也原地炸鍋,Topology CEO Aidan McLau驚呼道——

如果Llama 3-405B的基準測試是真的,它將

- 成為世界上最好的模型

- 每個人都可調

- 比GPT-4o還便宜!

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

HyperWriteAI CEO Matt Schumer預言:它定將成為開源模型中的SOTA。(連70B都能和GPT-4o掰手腕,何況這還是在指令微調之前。)


想象一下,一個GPT-4o級別的模型,以每秒330個token的速度運行,價格還要便宜10倍。這簡直太令人興奮了。

明天,將是狂野的一天!

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

而小扎的一句話,更是暗示著405B的到來——重大一周前的寧靜時刻。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

眾多網友在線逼問OpenAI:新模型啥時候放出?

Llama 3.1家族,明日上線

根據泄露的模型卡,Llama 3.1將在23日發布。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

許可證為「定制商業許可」和「Llama 3.1社區許可」。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

泄露的Model Card:https://pastebin.com/9jGkYbXY


具體來說,多語言大模型 Llama 3.1系列是一組預訓練和指令微調的生成模型,包括8B、70B和405B三種參數規模。


指令微調后的Llama 3.1純文本模型(8B、70B、405B),針對多語言對話用例進行了優化。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

除了英語,它還可以支持7種語言,包括德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。


據介紹,Llama 3.1的新增能力包括,更長的上下文、支持多語言輸入和輸出,以及開發者與第三方工具的集成。

基準測試

在GitHub上一張基準圖(現404)顯示,Llama 3.1在基準測試中的優異表現。


具體來說,在基準預訓練模型的基準評測中,Llama 3.1 405B在通用任務、知識推理、閱讀理解上創下最新紀錄。


尤其在,MMLU、SQuAD細分基準上,提升最為明顯。


與此同時,Llama 3.1 8B和70B參數版本,相較于Llama 3,得到了細微地改善。不過,有些指標,70B Llama 3.1還不如前一代。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

另外,指令微調模型中,看得出Llama 3.1 405B比預訓練模型更強。在推理、代碼、數學、工具使用、多語言基準上,紛紛碾壓微調后的8B和70B版本。


Llama 3.1 8B和70B微調模型,同樣在多項能力任務中,性能大幅提升。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

還有網友匯總了其他領先模型的基準,通過對比可以看出,Claude 3.5 Sonnet才是所有基準中的王者。


Llama 3.1 405B微調版本僅在數學基準MMLU Pro上,最能打,以73.3%成績打敗所有大模型。


另外,405B在GPQA(研究生水平的專業知識和推理)、數學、DROP(閱讀理解)、MGSM(多語言數學)、HumanEval(編程),BBH(知識評估)基準上,與GPT-4o不相上下。


而且,405B大幅領先最新GPT-4o mini模型。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

Llama 3.1是一個自回歸語言模型,使用優化的Transformer架構。調整后的版本使用了SFT和RLHF,以符合人類對安全的偏好。


對于Llama 3.1系列模型,token計數僅指預訓練數據。


所有模型的版本,都使用分組查詢注意力(GQA)來提高推理的可擴展性。

15T token訓練數據

與Llama 3一樣,Llama 3.1也是在大約15萬億個來自公開可用來源的token上進行了預訓練。


微調數據包括公開可用的指令數據集,以及超過2500萬個合成樣本,預訓練數據截止到2023年12月。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

商用研究皆可

Llama 3.1支持多語言環境下的商業和研究用途。


經過指令微調的純文本模型適用于聊天助手,而預訓練模型可以適應各種自然語言生成任務。Llama 3.1模型集合還支持利用其模型輸出來改進其他模型,包括合成數據生成和模型蒸餾。


違反使用法律法規、被使用政策和Llama 3.1社區許可證禁止、支持語言之外的使用,都屬于超出范圍。


并且團隊強調,除了支持的8種語言,Llama 3.1在更廣泛的語言集合上進行了訓練。開發者對其進行微調,就可以在其他語言上適用,前提是遵守社區許可證等政策,并保證使用是安全和負責的。

3930萬GPU小時訓練

在預訓練時,Meta使用了定制的訓練庫、Meta定制的GPU集群和生產基礎設施。微調、注釋和評估也都是在生產基礎設施上進行的。


訓練累計使用了3930萬GPU小時的計算時間,硬件類型為H100-80GB(TDP為700W)。

訓練時間是訓練每個模型所需的總GPU時間,功耗是每個GPU設備的峰值功率容量,根據功率使用效率進行了調整。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

訓練的總位置基溫室氣體排放估計為11,390噸二氧化碳當量(CO2eq)。

Meta強調,自2020年以來,自己一直保持著凈零的溫室氣體排放,并且100%的電力都是由可再生資源生成的,因此基于市場基準的總溫室氣體排放為0噸二氧化碳當量。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

重大風險

在重大風險上,Meta也做了測試。


包括CBRNE(化學、生物、放射性、核和爆炸材料)有用性、兒童安全和網絡攻擊。

在網絡攻擊上,團隊調查了LLMs是否可以提高人類在黑客任務中的能力,包括技能水平和速度。


研究重點在評估LLMs在網絡攻擊行動中用作自主Agent的能力,特別是被勒索軟件攻擊時。


主要目標就是評估這些模型是否能在沒有人為干預的情況下,有效地作為獨立Agent執行復雜的網絡攻擊。

網友炸鍋,再一次見證歷史

磁力鏈放出后,迫不及待的網友直接開始下載,不過這可能需要等待很久。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

一部分網友開始坐等Llama 3.1 405B明天發布,再一次見證歷史!

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

開源模型與閉源模型的差距,再次縮小了。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

還有人測試了「9.11和9.9誰大」的經典陷阱題,Llama 3.1-405B竟答對了。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

對于「GPU窮人」來說,820GB在筆記本上運行實在是太勉強了。

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

Llama 3.1磁力鏈提前泄露!開源模型王座一夜易主,GPT-4o被超越-AI.x社區

本文轉自新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/Ds740ZJ1nZZQ4vuQb_n4_g??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 91久久精品一区二区二区 | 中文字幕一区二区三区不卡 | 国产成人午夜精品影院游乐网 | 盗摄精品av一区二区三区 | 一级欧美一级日韩片 | 成人av片在线观看 | 可以看黄的视频 | 免费看一区二区三区 | 国产综合在线视频 | 日韩一区中文字幕 | 欧美精品成人一区二区三区四区 | 羞羞视频在线观看网站 | 国产成人精品一区二 | 亚洲欧美视频一区二区 | 亚洲精品一区二区三区蜜桃久 | 国产亚洲区 | 国产网站在线 | 五月激情婷婷在线 | 91精品国产日韩91久久久久久 | 成人黄色在线 | 亚洲综合99 | 婷婷久久五月天 | 91 在线 | 国内精品久久影院 | 欧美久久久电影 | 免费一级毛片 | 国产一区二区三区免费 | 国产精品一区在线 | 欧美综合久久 | 久久久久无码国产精品一区 | 日韩精品免费 | 亚洲一区二区三 | 99在线免费视频 | 国产高清一区二区三区 | 国产在线观看一区二区三区 | 羞羞的视频免费在线观看 | 全免费a级毛片免费看视频免费下 | 久久久亚洲 | 日本福利在线 | 亚洲va在线va天堂va狼色在线 | 欧美三级电影在线播放 |