成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

新聞 人工智能
最近,一個名叫「侏羅紀」模型號稱可以打敗GPT-3。究竟是誰這么有勇氣,居然敢如此叫囂?

 有人要膽敢挑戰GPT-3壟斷地位!

GPT-3自問世以來就成為了最大的AI語言模型之一。

不僅可以寫電郵、寫文章、創建網站、甚至是生成用于Python深度學習的代碼。

最近,一個名叫「侏羅紀」模型號稱可以打敗GPT-3。

究竟是誰這么有勇氣,居然敢如此叫囂?

[[417198]]

不是侏羅紀公園的恐龍!是Jurassic-1 Jumbo,還在公測的語言模型!

現在還可以免費體驗:

https://studio.ai21.com/playground

除了能將Python代碼轉成Javascript,這個語言模型還有什么過人之處?

膽大,但有實力

在機器學習中,參數是模型的一部分,從歷史訓練數據中學來的。

一般來說,在語言領域,參數越多,模型就越復雜。

Jurassic-1 Jumbo這個模型包含了1780億個參數。

一下子就甩開GPT-3足足30億個參數!

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

在詞匯項目上,GPT-3有50000個。

但Jurassic-1可以識別包括表達式、單詞和短語等共250000個。

涵蓋范圍比GPT-3在內的大多數現有模型更大。

Jurassic-1模型經過云訓練,在一個公共服務上有數百個分布式GPU。

token是一種在自然語言中將文本片段分成更小的單元的方法,它可以是單詞、字符或單詞的一部分。

而Jurassic-1訓練數據集就有3000億個token,全都是從維基百科、新聞出版物、StackExchange等英語網站編譯而來的。

模型的訓練采用傳統的自監督和自回歸的形式,對來自公開資源的3000億個token進行訓練。

優化程序方面,研究人員對J1-Large和J1-Jumbo分別使用了1.2×10-4和0.6×10-4的學習率,以及200萬和320萬個token的批大小。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

平均每字節對數概率表明模型在不同領域的適用性

研究人員表示,在幾乎所有的語料庫中,Jurassic-1模型都領先于GPT-3。

在小樣本學習的測試上則各有輸贏,不過平均得分兩個模型持平。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

在基準測試中,Jurassic-1回答學術和法律問題的表現已經能與GPT-3相當,甚至表現得更好。

GPT-3需要11個token,但Jurassic-1只需要4個,樣本效率大大增加。

當然,對于語言模型來說,最困難的莫過于邏輯和數學問題。

而Jurassic-1 Jumbo已經可以解決兩個大數相加這種非常簡單的算術問題。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

Jurassic可以解釋某個單詞的意思

在各種各樣的語言模型面前,Jurassic-1 Jumbo最多只能算是個后起之秀,也不是什么新奇的模型了。

不過和它的前輩們類似,如果問題描述不清,大概率出現的答案并不是你想要的。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

堪稱產品經理終結者。

偏見起來連自己人都「打」

Jurassic-1模型由AI21 Labs公司開發,會通過AI21 Labs的Studio平臺提供服務。

開發人員可以在公開測試版中構建虛擬代理和聊天機器人等應用程序原型。

除此之外,在公測版中,Jurassic-1模型和Studio還能用于釋義和總結,比如從產品描述中生成簡短的產品名稱。

根據新聞內容給新聞分類

同時,開發者還可以訓練自己的Jurassic-1模型,甚至只需要50-100個訓練實例。

訓練完成之后,就可以通過AI21 Studio使用這個自定義模型。

但是Jurassic-1也一樣面臨其它語言模型的「痛點」:對于性別、種族和宗教的偏見。

由于模型訓練數據集中或多或少都會存在偏見,訓練出來的模型也會跟著「學壞」。

有研究人員指出,GPT-3等類似的語言模型生成的文本可能會激化極右翼極端主義意識形態和行為。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

Jurassic模型的輸出面臨預設場景問題

針對這一點,AI2 Labs就在限制可以在公測中生成的文本數量,打算手動審查每個微調模型。

不過就算是經過微調的模型也難以擺脫訓練過程中「染上的惡習」。

就像Open AI的Codex,還是一樣會生成種族主義或者其它令人反感的可執行代碼。

1780億個參數,這個語言模型的誕生只為挑戰王者GPT-3?

雖然是以色列的研究人員開發的,但大概是受訓練數據集的影響,Jurassic-1似乎對猶太人的歧視比GPT-3還更重一些。

在偏見與歧視這個問題上,各個模型都是「五十步笑百步」。

不過AI21 Labs的工程師則表示,Jurassic-1模型的偏見比GPT-3少那么一丟丟。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-03-24 10:35:38

人工智能模型代碼

2024-05-20 08:50:00

模型神經網絡

2022-12-27 13:36:09

2021-12-10 15:46:18

谷歌模型人工智能

2021-07-13 17:38:49

算法語言模型GPT-4

2021-09-30 11:20:01

AI 數據人工智能

2024-04-19 09:17:33

AI模型

2021-03-23 15:21:00

人工智能機器學習技術

2021-09-08 17:23:33

谷歌模型開發

2022-03-10 09:48:11

人工智能機器學習模型

2022-10-24 10:27:37

谷歌模型

2021-11-02 09:36:04

AI 數據人工智能

2023-04-07 09:53:02

量子AI

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-03-01 16:15:16

2022-03-14 09:33:56

神經網絡模型人工智能

2023-06-08 15:33:31

人工智能GPT-3

2024-10-18 11:12:44

2023-02-14 08:00:00

人工智能GPT-3語言模型

2023-02-25 16:14:36

AIMeta語言模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久99深爱久久99精品 | 天天拍天天操 | 成人在线中文字幕 | 免费成人av | 日韩精品在线一区 | 久久久久久中文字幕 | 亚洲 精品 综合 精品 自拍 | 国产精品久久久久久福利一牛影视 | 亚洲福利av| 亚洲成人日韩 | 99re66在线观看精品热 | av一区在线观看 | 亚洲免费三级 | 欧美另类视频 | 日本午夜免费福利视频 | 日本一区二区电影 | 激情视频网站 | 在线视频91| 91视在线国内在线播放酒店 | 亚洲国产高清高潮精品美女 | 黄网站免费在线观看 | 久久久免费精品 | 久久久精品一区 | 欧美日韩国产精品激情在线播放 | 久久久久国产精品人 | 色99视频| 成人性生交大片免费看中文带字幕 | 欧美另类日韩 | 毛片a区| 可以看黄的视频 | 欧美做暖暖视频 | 亚洲精品丝袜日韩 | 日韩欧美在线视频 | 欧美一级免费看 | 一级a爱片久久毛片 | 国产精品亚洲精品日韩已方 | 午夜影院在线观看免费 | 亚洲精品电影在线观看 | 欧美不卡视频一区发布 | 国产精品亚洲视频 | 狠狠躁夜夜躁人人爽天天高潮 |