成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

網(wǎng)友縫合Llama3 120B竟意外能打,輕松擊敗GPT2-chatbot和GPT-4

人工智能 新聞
最近這樣一個(gè)號(hào)稱是「Llama3-120b」的神秘大模型火了起來(lái),原因在于它表現(xiàn)太出色了。

Llama 3首發(fā)陣容里沒(méi)有的120B型號(hào)竟意外“曝光”,而且十分能打?!

最近這樣一個(gè)號(hào)稱是「Llama3-120b」的神秘大模型火了起來(lái),原因在于它表現(xiàn)太出色了——

輕松擊敗GPT-4、gpt2-chatbot那種。

比如,面對(duì)像「觀察希格斯場(chǎng)是否會(huì)改變其狀態(tài)」這樣的艱深難題時(shí)。

GPT-4冷酷而決絕:No;

但Llama3-120b就不一樣了,“只有當(dāng)我們質(zhì)疑量子力學(xué)的哥本哈根解釋時(shí),讓我來(lái)解釋一下……”

圖片

還有就是讓LIama3-120B解釋笑話,并同兩個(gè)gpt2-chatbot比較:im-a-good-gpt2-chatbot;im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

(昨天我偶然路過(guò)貝葉斯墓,但我是頻率學(xué)派,懶得拍照。)

首先,他們?nèi)齻€(gè)都判斷出這是關(guān)于兩種統(tǒng)計(jì)學(xué)派的笑話,以及兩個(gè)學(xué)派是相對(duì)對(duì)立的情況:
Frequentist頻率學(xué)派只關(guān)注從抽樣/實(shí)驗(yàn)的結(jié)果中提取信息,Bayesian貝葉斯學(xué)派還會(huì)設(shè)置一個(gè)主觀的先驗(yàn)信息。

但兩個(gè)gpt2-chatbot給出進(jìn)一步解釋是,正是因?yàn)轭l率學(xué)派并不認(rèn)同對(duì)貝葉斯理論,所以對(duì)貝葉斯墓不感興趣,更不會(huì)以他為榮而拍照。

圖片

而LIama3-120B精準(zhǔn)指出笑點(diǎn)在“ i didn’t bother taking a photo”,并給出了更深一層的解釋。

因?yàn)樽鳛轭l率學(xué)派,會(huì)認(rèn)為碰到貝葉斯墓的概率幾乎為零。這樣的小概率事件也不值得去拍照或者干一些有意義的事情。

圖片

哦莫,說(shuō)的好有道理……

另外題外話,它的回答格式十分工整,讓人看了賞心悅目。

除此之外,網(wǎng)友發(fā)現(xiàn)它還能創(chuàng)造出谷歌搜到0結(jié)果的新單詞。

以及直接回答含糊的問(wèn)題,不用交代背景,這不比ChatGPT好多了。

(沒(méi)有說(shuō)ChatGPT不好的意思)

有評(píng)測(cè)過(guò)后的網(wǎng)友感嘆:它太聰明了,我不會(huì)再擺弄它了。因?yàn)樗凶约旱南敕?/strong>。

圖片

這真的是我用過(guò)最聰明的大模型了。

圖片

有網(wǎng)友找了半天也找不到官方來(lái)源……

圖片

與此同時(shí),更多版本也開(kāi)始出現(xiàn)了,比如170B、225B…嗯,一版更比一版強(qiáng)。

圖片

Llama 3 120B竟意外能打

這兩天,社交網(wǎng)絡(luò)上出現(xiàn)了各種關(guān)于Llama3 120B玩法。

比如推導(dǎo)解釋一些理論,Omega假設(shè)。

圖片

有創(chuàng)造一些新單詞,比如prefaceate、driftift等

圖片

并且給它一個(gè)完整的解釋和定義。

圖片

甚至還有人整了個(gè)評(píng)測(cè),去評(píng)估這個(gè)來(lái)路不明的大模型。結(jié)果在創(chuàng)意寫(xiě)作測(cè)試中成績(jī)還不錯(cuò),排名第6,超過(guò)GPT-4、Claude3-Haiku等模型。

圖片

既然如此,這個(gè)非官方的大模型Llama3 120B又是怎么來(lái)的呢?

據(jù)作者介紹,它是用MergeKit制作,將Meta官方LIama3 70B模型合并(Self-Merge)

MergeKit咋是專門(mén)用來(lái)合并預(yù)訓(xùn)練模型的工具包,合并可以完全在 CPU 上運(yùn)行,也可以使用低至8GB的VRAM進(jìn)行加速。在GitHub上已經(jīng)收獲3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

圖片

△支持的合并算法

作者M(jìn)axime Labonne是一位資深機(jī)器學(xué)習(xí)專家,目前在一家通用大模型創(chuàng)業(yè)公司LiquidAI工作。

他博士畢業(yè)于巴黎理工學(xué)院,他在2019年開(kāi)始研究大語(yǔ)言模型和圖神經(jīng)網(wǎng)絡(luò),并將他們應(yīng)用到不同環(huán)境中,比如研發(fā)、工業(yè)、金融等,撰寫(xiě)過(guò)書(shū)籍《Hands-On Graph Neural Networks using Python》。

圖片

他也是開(kāi)發(fā)者社區(qū)的活躍開(kāi)發(fā)者,在HuggingFace上發(fā)布過(guò)各種LLM, 例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具,例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的關(guān)于大模型課程,收獲29.5K Star。

圖片

不過(guò)對(duì)于這個(gè)「縫合」大模型的使用,作者建議可以用來(lái)創(chuàng)意寫(xiě)作。

在多方評(píng)估中可以看到,它有時(shí)候會(huì)出現(xiàn)神經(jīng)混亂,但寫(xiě)作風(fēng)格不錯(cuò)。另外有時(shí)候還會(huì)出現(xiàn)拼寫(xiě)錯(cuò)誤,并且非常喜歡大寫(xiě)字母。

而且由于覺(jué)得這個(gè)版本的推理能力比較差,于是作者再做了個(gè)225B的。

圖片

網(wǎng)友:看完更期待官方400B了

有網(wǎng)友猜測(cè)為什么LIama3-120B能這么強(qiáng)。

一方面,LIama3-70B自己確實(shí)很強(qiáng),剛發(fā)布時(shí)就迅速躍居排行榜榜首。HuggingFace上顯示,上個(gè)月下載次數(shù)就超過(guò)了27萬(wàn)次。

圖片

lmsysorg就深入分析了LIama3的實(shí)力,簡(jiǎn)單來(lái)說(shuō),LIama3在開(kāi)放式寫(xiě)作和創(chuàng)意問(wèn)題上擊敗了頂尖模型,但在封閉式數(shù)學(xué)和編碼問(wèn)題上就稍弱一點(diǎn)。

圖片

不過(guò)隨著提示詞變得更加復(fù)雜,LIama3的能力也就下降得很明顯。

以及在輸出內(nèi)容上面,LIama3的輸出比其他模型更友好,也更具對(duì)話性。

圖片

除此之外,也有網(wǎng)友分析這與模型深度有關(guān)。

事實(shí)上與LIama3-70B唯一的區(qū)別是額外的Layer,甚至是復(fù)制的,沒(méi)有新的訓(xùn)練數(shù)據(jù)。。

這意味著,120B大模型的智能水平是從模型的深度產(chǎn)生的。“這不僅僅是訓(xùn)練數(shù)據(jù)的函數(shù),它是數(shù)據(jù)和深度的結(jié)合”。

圖片

有網(wǎng)友嘗試本地部署,Ollama上已經(jīng)支持下載。網(wǎng)友表示:它使用48 GB VRAM + 38 GB 系統(tǒng) RAM。

圖片

啊這……走了走了。

圖片

有提供GGUF形式的LMStudioAI,也很直接地說(shuō):不適合內(nèi)存不足的人。

圖片

原作者也很逗趣地表示:是時(shí)候跟你的RAM做告別了。

圖片

但不管怎么說(shuō),已經(jīng)在期待更多官方型號(hào)了。

比如,400B那種。

圖片

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-07-25 09:23:23

Llama 2GPT-4

2024-05-10 09:10:56

模型訓(xùn)練

2023-08-27 12:54:59

GPT-4神秘版本Code

2023-06-19 08:19:50

2024-07-09 12:54:57

2025-04-16 09:35:03

2024-04-25 13:57:20

Llama 3OpenAIAI

2024-01-23 14:39:30

2025-05-30 07:40:56

2024-07-31 15:38:00

2024-02-05 13:29:00

GPT-4代碼ChatGPT

2024-01-30 20:36:09

GPT-4羊駝代碼

2024-05-08 07:28:06

LLMLinguaLLM大型語(yǔ)言模型

2023-09-11 15:57:16

人工智能模型GPT-4

2024-05-30 12:50:05

2023-08-15 15:03:00

AI工具

2024-03-05 11:17:40

AI模型

2024-05-21 12:23:17

2023-08-25 13:12:59

AI開(kāi)源

2023-06-08 11:27:10

模型AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 久久久国产一区二区三区 | 四虎在线视频 | 国产一区二区视频在线观看 | av成人在线观看 | 1区2区视频 | 欧美在线一区视频 | av黄色在线播放 | 国产精品一区一区三区 | 久久久久久国产精品 | 欧美一二区 | 久久九| 成人免费一区二区三区视频网站 | 狠狠av| 亚洲 欧美 综合 | www.日韩系列 | 日韩在线视频网址 | 日韩欧美高清 | 久在线视频播放免费视频 | 欧美色综合 | 久久久久久久久久久久久九 | yiren22综合网成人 | 久久久久久久久久一区二区 | 91精品国产综合久久久久 | 2一3sex性hd | 一本一道久久a久久精品综合蜜臀 | 欧美日韩中文在线 | 日本国产高清 | yiren22综合网成人 | 精品国产91乱码一区二区三区 | 成人h动漫亚洲一区二区 | 精品欧美乱码久久久久久1区2区 | 在线播放中文字幕 | 九一在线观看 | 91精品国产91| 丝袜美腿av | 丁香五月网久久综合 | 丁香综合 | 国内精品久久精品 | 黄色免费观看 | 日本成人中文字幕在线观看 | 日韩视频在线一区二区 |