網(wǎng)友縫合Llama3 120B竟意外能打，輕松擊敗GPT2-chatbot和GPT-4

作者：量子位 2024-05-13 12:38:08

人工智能新聞

最近這樣一個(gè)號(hào)稱是「Llama3-120b」的神秘大模型火了起來(lái)，原因在于它表現(xiàn)太出色了。

Llama 3首發(fā)陣容里沒(méi)有的120B型號(hào)竟意外“曝光”，而且十分能打？！

最近這樣一個(gè)號(hào)稱是「Llama3-120b」的神秘大模型火了起來(lái)，原因在于它表現(xiàn)太出色了——

輕松擊敗GPT-4、gpt2-chatbot那種。

比如，面對(duì)像「觀察希格斯場(chǎng)是否會(huì)改變其狀態(tài)」這樣的艱深難題時(shí)。

GPT-4冷酷而決絕：No；

但Llama3-120b就不一樣了，“只有當(dāng)我們質(zhì)疑量子力學(xué)的哥本哈根解釋時(shí)，讓我來(lái)解釋一下……”

還有就是讓LIama3-120B解釋笑話，并同兩個(gè)gpt2-chatbot比較：im-a-good-gpt2-chatbot；im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

（昨天我偶然路過(guò)貝葉斯墓，但我是頻率學(xué)派，懶得拍照。）

首先，他們?nèi)齻€(gè)都判斷出這是關(guān)于兩種統(tǒng)計(jì)學(xué)派的笑話，以及兩個(gè)學(xué)派是相對(duì)對(duì)立的情況：
Frequentist頻率學(xué)派只關(guān)注從抽樣/實(shí)驗(yàn)的結(jié)果中提取信息，Bayesian貝葉斯學(xué)派還會(huì)設(shè)置一個(gè)主觀的先驗(yàn)信息。

但兩個(gè)gpt2-chatbot給出進(jìn)一步解釋是，正是因?yàn)轭l率學(xué)派并不認(rèn)同對(duì)貝葉斯理論，所以對(duì)貝葉斯墓不感興趣，更不會(huì)以他為榮而拍照。

而LIama3-120B精準(zhǔn)指出笑點(diǎn)在“ i didn’t bother taking a photo”，并給出了更深一層的解釋。

因?yàn)樽鳛轭l率學(xué)派，會(huì)認(rèn)為碰到貝葉斯墓的概率幾乎為零。這樣的小概率事件也不值得去拍照或者干一些有意義的事情。

哦莫，說(shuō)的好有道理……

另外題外話，它的回答格式十分工整，讓人看了賞心悅目。

除此之外，網(wǎng)友發(fā)現(xiàn)它還能創(chuàng)造出谷歌搜到0結(jié)果的新單詞。

以及直接回答含糊的問(wèn)題，不用交代背景，這不比ChatGPT好多了。

（沒(méi)有說(shuō)ChatGPT不好的意思）

有評(píng)測(cè)過(guò)后的網(wǎng)友感嘆：它太聰明了，我不會(huì)再擺弄它了。因?yàn)樗凶约旱南敕?/strong>。

這真的是我用過(guò)最聰明的大模型了。

有網(wǎng)友找了半天也找不到官方來(lái)源……

與此同時(shí)，更多版本也開(kāi)始出現(xiàn)了，比如170B、225B…嗯，一版更比一版強(qiáng)。

Llama 3 120B竟意外能打

這兩天，社交網(wǎng)絡(luò)上出現(xiàn)了各種關(guān)于Llama3 120B玩法。

比如推導(dǎo)解釋一些理論，Omega假設(shè)。

有創(chuàng)造一些新單詞，比如prefaceate、driftift等

并且給它一個(gè)完整的解釋和定義。

甚至還有人整了個(gè)評(píng)測(cè)，去評(píng)估這個(gè)來(lái)路不明的大模型。結(jié)果在創(chuàng)意寫(xiě)作測(cè)試中成績(jī)還不錯(cuò)，排名第6，超過(guò)GPT-4、Claude3-Haiku等模型。

既然如此，這個(gè)非官方的大模型Llama3 120B又是怎么來(lái)的呢？

據(jù)作者介紹，它是用MergeKit制作，將Meta官方LIama3 70B模型合并（Self-Merge）

MergeKit咋是專門(mén)用來(lái)合并預(yù)訓(xùn)練模型的工具包，合并可以完全在 CPU 上運(yùn)行，也可以使用低至8GB的VRAM進(jìn)行加速。在GitHub上已經(jīng)收獲3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

△支持的合并算法

作者M(jìn)axime Labonne是一位資深機(jī)器學(xué)習(xí)專家，目前在一家通用大模型創(chuàng)業(yè)公司LiquidAI工作。

他博士畢業(yè)于巴黎理工學(xué)院，他在2019年開(kāi)始研究大語(yǔ)言模型和圖神經(jīng)網(wǎng)絡(luò)，并將他們應(yīng)用到不同環(huán)境中，比如研發(fā)、工業(yè)、金融等，撰寫(xiě)過(guò)書(shū)籍《Hands-On Graph Neural Networks using Python》。

他也是開(kāi)發(fā)者社區(qū)的活躍開(kāi)發(fā)者，在HuggingFace上發(fā)布過(guò)各種LLM，例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具，例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的關(guān)于大模型課程，收獲29.5K Star。

不過(guò)對(duì)于這個(gè)「縫合」大模型的使用，作者建議可以用來(lái)創(chuàng)意寫(xiě)作。

在多方評(píng)估中可以看到，它有時(shí)候會(huì)出現(xiàn)神經(jīng)混亂，但寫(xiě)作風(fēng)格不錯(cuò)。另外有時(shí)候還會(huì)出現(xiàn)拼寫(xiě)錯(cuò)誤，并且非常喜歡大寫(xiě)字母。

而且由于覺(jué)得這個(gè)版本的推理能力比較差，于是作者再做了個(gè)225B的。

網(wǎng)友：看完更期待官方400B了

有網(wǎng)友猜測(cè)為什么LIama3-120B能這么強(qiáng)。

一方面，LIama3-70B自己確實(shí)很強(qiáng)，剛發(fā)布時(shí)就迅速躍居排行榜榜首。HuggingFace上顯示，上個(gè)月下載次數(shù)就超過(guò)了27萬(wàn)次。

lmsysorg就深入分析了LIama3的實(shí)力，簡(jiǎn)單來(lái)說(shuō)，LIama3在開(kāi)放式寫(xiě)作和創(chuàng)意問(wèn)題上擊敗了頂尖模型，但在封閉式數(shù)學(xué)和編碼問(wèn)題上就稍弱一點(diǎn)。

不過(guò)隨著提示詞變得更加復(fù)雜，LIama3的能力也就下降得很明顯。

以及在輸出內(nèi)容上面，LIama3的輸出比其他模型更友好，也更具對(duì)話性。

除此之外，也有網(wǎng)友分析這與模型深度有關(guān)。

事實(shí)上與LIama3-70B唯一的區(qū)別是額外的Layer，甚至是復(fù)制的，沒(méi)有新的訓(xùn)練數(shù)據(jù)。。

這意味著，120B大模型的智能水平是從模型的深度產(chǎn)生的。“這不僅僅是訓(xùn)練數(shù)據(jù)的函數(shù)，它是數(shù)據(jù)和深度的結(jié)合”。

有網(wǎng)友嘗試本地部署，Ollama上已經(jīng)支持下載。網(wǎng)友表示：它使用48 GB VRAM + 38 GB 系統(tǒng) RAM。

啊這……走了走了。

有提供GGUF形式的LMStudioAI，也很直接地說(shuō)：不適合內(nèi)存不足的人。

原作者也很逗趣地表示：是時(shí)候跟你的RAM做告別了。

但不管怎么說(shuō)，已經(jīng)在期待更多官方型號(hào)了。

比如，400B那種。

責(zé)任編輯：張燕妮來(lái)源：量子位

AI 訓(xùn)練

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

Llama 2 vs GPT-4：有何區(qū)別？
了解Llama2和GPT4之間的主要區(qū)別，它們是自然語(yǔ)言處理的領(lǐng)先巨頭。揭示它們的優(yōu)勢(shì)、劣勢(shì)以及它們?nèi)绾嗡茉煺Z(yǔ)言技術(shù)的未來(lái)。

2023-07-25 09:23:23

Llama 2 GPT-4

閉源趕超GPT-4 Turbo、開(kāi)源擊敗Llama-3-70B，歪果仁：這中國(guó)大模型真香
在發(fā)布一周年之際，阿里云通義千問(wèn)大模型在閉源和開(kāi)源領(lǐng)域都交上了一份滿意的答卷。

2024-05-10 09:10:56

模型訓(xùn)練

完勝GPT-4，秒殺閉源模型！Code Llama神秘版本曝光
Meta開(kāi)源的CodeLlama即將迎來(lái)大波二創(chuàng)，WizardCoder以73.2%的勝率碾壓GPT4。OpenAI員工爆出Llama3能打GPT4，仍將開(kāi)源。

2023-08-27 12:54:59

GPT-4 神秘版本 Code

【GPT-4理論篇】GPT-4核心技術(shù)探秘
GPT4究竟會(huì)不會(huì)帶來(lái)第四次工業(yè)革命，這是一個(gè)需要時(shí)間驗(yàn)證的話題，我也沒(méi)有資格在這給出結(jié)論，但GPT4對(duì)與我個(gè)人的影響是巨大的。

2023-06-19 08:19:50

RAG微調(diào)Llama 3竟超越GPT-4！英偉達(dá)GaTech華人學(xué)者提出RankRAG框架
來(lái)自佐治亞理工學(xué)院和英偉達(dá)的兩名華人學(xué)者帶隊(duì)提出了名為RankRAG的微調(diào)框架，簡(jiǎn)化了原本需要多個(gè)模型的復(fù)雜的RAG流水線，用微調(diào)的方法交給同一個(gè)LLM完成，結(jié)果同時(shí)實(shí)現(xiàn)了模型在RAG任務(wù)上的性能提升。

2024-07-09 12:54:57

永別了，GPT-4！
GPT4時(shí)代，落幕了！它將被GPT4o完全取代。而下周，我們也極有可能迎來(lái)GPT4.1、o3滿血版以及o4mini這些新模型。大模型進(jìn)化史，再次迎來(lái)關(guān)鍵節(jié)點(diǎn)。

2025-04-16 09:35:03

Llama 3沒(méi)能逼出GPT-5！OpenAI怒“卷”To B戰(zhàn)場(chǎng)，新企業(yè)級(jí) AI 功能重磅推出！
Llama3在開(kāi)源的狀態(tài)下做到了GPT3.7的水平，必然會(huì)顯得用戶（尤其是企業(yè)用戶，他們更具備獨(dú)立部署Llama3的能力）花錢買來(lái)的GPT4沒(méi)那么香了。網(wǎng)友于是紛紛拱火，“鼓勵(lì)”O(jiān)penAI交出GPT5，才能繼續(xù)穩(wěn)坐大模型王位。

2024-04-25 13:57:20

Llama 3 OpenAI AI

GPT-4擊敗華爾街？最新研究：選股回報(bào)超40%
根據(jù)我們的研究，ChatGPT能夠預(yù)測(cè)股市價(jià)格走勢(shì)，并產(chǎn)生超過(guò)500%的回報(bào)。

2024-01-23 14:39:30

DeepSeek免費(fèi)超越GPT-4？
DeepSeek最新發(fā)布了R10528版本，這次更新的最大亮點(diǎn)是"深度思考"能力大幅提升。想體驗(yàn)最新版本？很簡(jiǎn)單：進(jìn)入DeepSeek官網(wǎng)、APP或小程序，在對(duì)話界面開(kāi)啟"深度思考"功能即可。

2025-05-30 07:40:56

4輪暴訓(xùn)，Llama 7B擊敗GPT-4！Meta等讓LLM「分飾三角」自評(píng)自進(jìn)化
Meta、UC伯克利、NYU共同提出元獎(jiǎng)勵(lì)語(yǔ)言模型，給「超級(jí)對(duì)齊」指條明路：讓AI自己當(dāng)裁判，自我改進(jìn)對(duì)齊，效果秒殺自我獎(jiǎng)勵(lì)模型。

2024-07-31 15:38:00

打臉奧特曼，GPT-4今年比去年還懶！網(wǎng)友在線實(shí)測(cè)出爐
關(guān)于GPT4變懶，網(wǎng)友的吐槽已是不計(jì)其數(shù)，其中最多的就是與代碼相關(guān)的任務(wù)：完成度不高不說(shuō)，還會(huì)被分割成一個(gè)一個(gè)小塊，使用時(shí)需要逐一復(fù)制。

2024-02-05 13:29:00

GPT-4 代碼 ChatGPT

編程能力超GPT-4，羊駝代碼版“超大杯”來(lái)了，小扎還親自劇透Llama3
在HumanEval測(cè)試中，CodeLlama70B的表現(xiàn)在開(kāi)源代碼模型中位列第一，甚至超越了GPT4。此次發(fā)布的超大杯，保持著與小號(hào)版本相同的許可協(xié)議，也就是仍然可以免費(fèi)商用。

2024-01-30 20:36:09

GPT-4 羊駝代碼

使用LLMLingua-2壓縮GPT-4和Claude提示
LLMLingua2與其他提示壓縮方法相比更快、更高效，并且需要更少的計(jì)算資源。對(duì)于涉及冗長(zhǎng)提示和壓縮的LLM應(yīng)用程序來(lái)說(shuō)，它是一個(gè)很好的工具，可以節(jié)省大量成本，并獲得更好的用戶體驗(yàn)。

2024-05-08 07:28:06

LLMLingua LLM 大型語(yǔ)言模型

Meta 正在構(gòu)建新開(kāi)源大模型，性能超越 Llama 2、比肩 GPT-4
長(zhǎng)期以來(lái)，Meta一直在采用開(kāi)源方法公開(kāi)其大模型產(chǎn)品，是業(yè)內(nèi)眾所周知的最大貢獻(xiàn)者之一。僅今年它就向人工智能社區(qū)發(fā)布了大量人工智能模型和訓(xùn)練數(shù)據(jù)集。

2023-09-11 15:57:16

人工智能模型 GPT-4

速度秒掉GPT-4o、22B擊敗Llama 3 70B，Mistral AI開(kāi)放首個(gè)代碼模型
作為一個(gè)專為代碼生成任務(wù)設(shè)計(jì)的開(kāi)放式生成AI模型，Codestral通過(guò)共享指令和補(bǔ)全API端點(diǎn)幫助開(kāi)發(fā)人員編寫(xiě)并與代碼交互。Codestral精通代碼和英語(yǔ)，因而可為軟件開(kāi)發(fā)人員設(shè)計(jì)高級(jí)AI應(yīng)用。

2024-05-30 12:50:05

Altman力推GPT-4新應(yīng)用：讓GPT-4能穿梭時(shí)空，過(guò)目不忘的私人AI助理
Rewind是一款結(jié)合了GPT4能力的時(shí)空搜索工具。每個(gè)月只要12刀，就能獲得一個(gè)過(guò)目不忘的AI助理。

2023-08-15 15:03:00

AI 工具

GPT-4時(shí)代已過(guò)？全球網(wǎng)友實(shí)測(cè)Claude 3，只有震撼
昨晚，OpenAI最大的競(jìng)爭(zhēng)對(duì)手Anthropic發(fā)布了新一代AI大模型系列——Claude3。

2024-03-05 11:17:40

AI 模型

一文讀懂 GPT-4o vs GPT-4 Turbo
GPT4o作為OpenAI最新推出的多模態(tài)大模型，其性能與前代GPT4Turbo相比，具有質(zhì)的飛躍。這里，我們可以從如下個(gè)關(guān)鍵方面對(duì)兩者進(jìn)行對(duì)比分析。

2024-05-21 12:23:17

官方的Code Llama開(kāi)源：免費(fèi)商用，神秘版本接近GPT-4
GPT4：在代碼生成這塊，你們依然是「弟弟」。相關(guān)論文《CodeLlama:OpenFoundationModelsforCode》已經(jīng)公布，足足有47頁(yè)，作者有25位。

2023-08-25 13:12:59

AI 開(kāi)源

基于LLaMA微調(diào)，性能超過(guò)GPT-4
UC伯克利華人博士生搞了個(gè)Gorilla，可以靈活調(diào)用各種API，性能超過(guò)GPT4。

2023-06-08 11:27:10

模型 AI

相似話題

機(jī)器學(xué)習(xí)
2034內(nèi)容

深度學(xué)習(xí)
1699內(nèi)容

自然語(yǔ)言處理
 110內(nèi)容

語(yǔ)音識(shí)別
 107內(nèi)容
全部話題

同話題下的熱門(mén)內(nèi)容

第一次用Cursor？四步驟快速安裝＋五大功能界面說(shuō)明 VSCode AI 編程必裝！五款DeepSeek集成插件，每款都讓開(kāi)發(fā)效率飆升從OCR瓶頸到結(jié)構(gòu)化理解來(lái)有效提升RAG的效果阿里發(fā)布信息檢索Agent，可自主上網(wǎng)查資料，GAIA基準(zhǔn)超越GPT-4o OpenAI 停工一周，緊急調(diào)薪！Meta滅霸式天價(jià)挖8名OpenAI大佬！緊急回應(yīng)：我們被偷家了！與Meta沖突是支線任務(wù)！ElementPlusX + RuoyiAI：Vue3 首個(gè) AI 開(kāi)發(fā)模板開(kāi)源了！甭提靜態(tài)AI了，MIT新框架讓模型具備自學(xué)能力當(dāng)Gemini CLI遇見(jiàn)n8n：免費(fèi)擼Google頂級(jí)模型的玩法

相關(guān)專題更多

HarmonyOS NEXT 高效開(kāi)發(fā)與創(chuàng)新實(shí)踐

馭浪者無(wú)疆：蛻變新生，以定馭變

2025-06-04 14:38:36

開(kāi)發(fā)者成長(zhǎng)學(xué)院 | 成長(zhǎng)有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

網(wǎng)友縫合Llama3 120B竟意外能打，輕松擊敗GPT2-chatbot和GPT-4

Llama 3 120B竟意外能打

△支持的合并算法

網(wǎng)友：看完更期待官方400B了