成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

340B險勝70B,Kimi機器人貼臉“嘲諷”英偉達新開源模型

人工智能 新聞
英偉達上周五突然宣布開源Nemotron-4 340B,該系列包括基礎模型、指令模型和獎勵模型,用于生成訓練和改進LLM的合成數據。

排名超過Llama-3-70B,英偉達Nemotron-4 340B問鼎競技場最強開源模型!

前兩天,英偉達突然開源了其通用大模型Nemotron的3400億參數版本。

就在最近,競技場更新了排名情況:

圖片

勝率熱圖顯示,Nemotron-4 340B對陣Llama-3-70B的勝率為53%

圖片

究竟Nemotron-4 340B表現如何?接下來一起看看。

新模型最新戰績

簡單回顧一下,英偉達上周五突然宣布開源Nemotron-4 340B,該系列包括基礎模型、指令模型和獎勵模型,用于生成訓練和改進LLM的合成數據。

Nemotron-4 340B一經發布便瞬時登頂Hugging Face RewardBench 榜一

圖片

緊接著,競技場新近公布了Nemotron-4 340B的一系列測評結果。

長文本查詢(長度>=500個token)中,Nemotron-4 340B排在第5位,超過Claude 3 Sonnet及Qwen 2-72B等主流開源模型。

圖片

處理硬提示方面,Nemotron-4 340B超越了Claude 3 Sonnet和Llama3 70B-Instruct,顯示出其在應對復雜和高難度查詢時的卓越能力。

圖片

整體性能評估中,Nemotron-4 340B的評分和穩定性均處于中上水平,超越了多款知名開源模型。

圖片

概括一下,Nemotron-4 340B已經取得了不錯的戰績,直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,有時甚至可以和GPT-4一較高下。

其實,以前這個模型就曾登上大模型競技場LMSys Chatbot Arena,當時它的別名是june-chatbot

圖片

具體來說,這個模型支持4K上下文窗口、50多種自然語言和40多種編程語言,訓練數據截止到2023年6月。

訓練數據方面,英偉達采用了高達9萬億個token。其中,8萬億用于預訓練,1萬億用于繼續訓練以提高質量。

BF16精度下,模型的推理需要8塊H200,或16塊H100/A100 80GB。如果是在FP8精度下,則只需8塊H100。

圖片

值得一提的是,指令模型的訓練是在98%的合成數據上完成的。

而合成數據無疑是Nemotron-4 340B的最大亮點,它有可能徹底改變訓練LLM的方式。

合成數據才是未來

面對最新排名,興奮的網友們突然咂摸出一絲不對勁:

用340B對戰70B,而且還是險勝,這事兒有點說不過去吧!

圖片

就連機器人Kimi也對此開啟了“嘲諷”模式:

英偉達這波操作,參數大得像宇宙,性能卻跟Llama-3-70B肩并肩,科技界的”大號小能”啊!

圖片

對此,在英偉達負責AI模型對齊和定制的Oleksii Kuchaiev拿出了關鍵法寶:

圖片

是的,Nemotron-4 340B商用友好,支持生成合成數據

高級深度學習研究工程師Somshubra Majumdar對此表示大贊:

你可以用它(免費)生成你想要的所有數據

圖片

這一突破性進展,標志著AI行業的一個重要里程碑——

從此,各行各業都無需依賴大量昂貴的真實世界數據集了,用合成數據,就可以創建性能強大的特定領域LLM!

那么,英偉達具體是如何實現的呢?

一句話概括,這與它開源通常不發布的獎勵模型有關。

圖片

生成高質量合成數據不僅需要優秀的指導模型,還需根據特定需求進行數據篩選。

通常,使用同一模型作為評分者(LLM-as-Judge);但在特定情況下,采用專門的獎勵模型(Reward-Model-as-Judge)進行評估更為合適。

而Nemotron-4 340B指令模型可以生成高質量的數據,然后獎勵模型可以過濾掉多個屬性的數據。

它會根據有用性、正確性、一致性、復雜性和冗長性這5個屬性,對響應評分。

圖片

另外,研究者可以使用自己的專用數據,再結合HelpSteer2數據集,定制Nemotron-4 340B基礎模型,以創建自己的指令或獎勵模型。

回到一開頭和Llama-3-70B的對戰,Nemotron-4 340B擁有更寬松的許可,或許這才是它的真正價值所在。

畢竟數據短缺早已成為業內普遍痛點。

圖片

據Epoch研究所的AI研究員Pablo Villalobos預測,到2024年年中,對高質量數據的需求超過供給的可能性為50%,到2026年發生這種情況的可能性為90%。

新的預期顯示,這種短缺風險將延遲至2028年。

合成數據才是未來正逐漸成為行業共識……

模型地址:https://huggingface.co/nvidia/Nemotron-4-340B-Instruct

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-06-17 08:55:00

2024-10-17 13:30:00

2025-01-08 09:30:00

Meta大模型訓練

2024-11-25 08:20:00

2024-09-09 08:50:00

2024-12-18 07:10:00

2024-06-05 08:33:29

2025-03-24 08:06:00

2025-03-19 10:05:02

2023-08-14 13:29:37

2025-06-17 09:07:24

2024-05-30 12:50:05

2023-10-09 12:36:08

人工智能數據

2024-04-30 08:28:44

開源大模型Llama

2024-04-09 13:21:00

AI開源

2020-10-27 10:37:40

機器人

2023-10-12 14:40:10

AI模型

2024-12-19 07:10:00

2024-11-01 07:30:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲色图50p | 成人影院在线观看 | 在线高清免费观看视频 | 亚洲精品在线观看视频 | 激情91| 国产精品欧美一区喷水 | 国产精品性做久久久久久 | 综合国产 | 91在线电影 | 日韩欧美一区二区三区免费观看 | 欧美网址在线观看 | 国产视频中文字幕 | www.黄色网| 国产www成人 | 色爱综合网 | 国产精品1区2区3区 国产在线观看一区 | 久久国产欧美日韩精品 | 成人午夜视频在线观看 | 午夜理伦三级理论三级在线观看 | 国产传媒在线观看 | 自拍偷拍中文字幕 | 日韩视频精品在线 | 91视频久久 | 国产精品精品视频一区二区三区 | 免费一级淫片aaa片毛片a级 | 欧美一区二区三区在线观看视频 | 国产精品污污视频 | 日本一区视频在线观看 | 欧美精品一区二区三 | av在线一区二区 | 亚洲精品一区二区三区 | 精品国产99 | 国产成人精品一区二区在线 | 国产特级毛片aaaaaa | 黄色av一区| 成人在线视频网址 | 国产一区二区三区免费 | 成人欧美一区二区三区黑人孕妇 | 亚洲成av人片在线观看 | 久久人人国产 | 成人精品 |