成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

馬斯克突然開源Grok:3140億參數巨無霸,免費可商用

開源 人工智能
代碼和模型權重已上線GitHub。官方信息顯示,此次開源的Grok-1是一個3140億參數的混合專家模型——就是說,這是當前開源模型中參數量最大的一個。

馬斯克說到做到:

旗下大模型Grok現已開源!

圖片

代碼和模型權重已上線GitHub。官方信息顯示,此次開源的Grok-1是一個3140億參數的混合專家模型——

就是說,這是當前開源模型中參數量最大的一個。

消息一出,Grok-1的GitHub倉庫已攬獲4.5k標星,并且還在庫庫猛漲。

圖片

表情包們,第一時間被吃瓜群眾們熱傳了起來。

圖片

而ChatGPT本Chat,也現身Grok評論區,開始了和馬斯克新一天的斗嘴……

圖片

那么,話不多說,來看看馬斯克這波為懟OpenAI,究竟拿出了什么真東西。

Grok-1說開源就開源

此次開源,xAI發布了Grok-1的基本模型權重和網絡架構。

具體來說是2023年10月預訓練階段的原始基礎模型,沒有針對任何特定應用(例如對話)進行微調。

結構上,Grok-1采用了混合專家(MoE)架構,包含8個專家,總參數量為314B(3140億),處理Token時,其中的兩個專家會被激活,激活參數量為86B。

單看這激活的參數量,就已經超過了密集模型Llama 2的70B,對于MoE架構來說,這樣的參數量稱之為龐然大物也毫不為過。

圖片

不過,在GitHub頁面中,官方也提示,由于模型規模較大(314B參數),需要有足夠GPU和內存的機器才能運行Grok。

這里MoE層的實現效率并不高,選擇這種實現方式是為了避免驗證模型的正確性時需要自定義內核。

模型的權重文件則是以磁力鏈接的形式提供,文件大小接近300GB。

圖片

而且這個“足夠的GPU”,要求不是一般的高——YC上有網友推測,如果是8bit量化的話,可能需要8塊H100。

圖片

除了參數量前所未有,在工程架構上,Grok也是另辟蹊徑——

沒有采用常見的Python、PyTorch或Tensorflow,而是選用了Rust編程語言以及深度學習框架新秀JAX。

而在官方通告之外,還有許多大佬通過扒代碼等方式揭露了Grok的更多技術細節。

比如來自斯坦福大學的Andrew Kean Gao,就針對Grok的技術細節進行了詳細解釋。

首先,Grok采用了使用旋轉的embedding方式,而不是固定位置embedding,旋轉位置的embedding大小為 6144,與輸入embedding相同。

圖片

當然,還有更多的參數信息:

  • 窗口長度為8192tokens,精度為bf16。
  • Tokenizer vocab大小為131072(2^17),與GPT-4接近。
  • embedding大小為6144(48×128)。
  • Transformer層數為64,每層都有一個解碼器層,包含多頭注意力塊和密集塊。
  • key value大小為128。
  • 多頭注意力塊中,有48 個頭用于查詢,8 個用于KV,KV 大小為 128。
  • 密集塊(密集前饋塊)擴展因子為8,隱藏層大小為32768。

圖片

除了Gao,還有英偉達AI科學家Ethan He(何宜暉)指出,在專家系統的處理方面,Grok也與另一知名開源MoE模型Mixtral不同——

Grok對全部的8個專家都應用了softmax函數,然后從中選擇top2專家,而Mixtral則是先選定專家再應用softmax函數。

圖片

而至于有沒有更多細節,可能要看官方會不會發布進一步的消息了。

另外,值得一提的是,Grok-1采用的是Apache 2.0 license,也就是說,商用友好。

為懟OpenAI怒而Open

大家伙知道,馬斯克因為OpenAI不Open,已經向舊金山高等法院提起訴訟,正式把OpenAI給告了。

不過當時馬斯克自己搞的Grok也并沒有開源,還只面向??的付費用戶開放,難免被質疑雙標。

大概是為了堵上這個bug,馬斯克在上周宣布:

本周,xAI將開源Grok。

圖片

雖然時間點上似乎又是馬斯克一貫的遲到風格,但xAI的這波Open如今看來確實不是口嗨,還是給了網友們一些小小的震撼。

圖片

有xAI新晉員工感慨說:

這將是激動人心的一年,快系好安全帶吧。

圖片

有人已經期待起Grok作為一個開源模型,進一步攪動大模型競爭的這一池水。

不過,也并不是每個人都買馬斯克的賬:

圖片

不過說歸說,多線并進的馬斯克,最近大事不止開源Grok這一件。

作為多公司、多業務的時間管理大師,馬斯克旗下,特斯拉剛剛全線推出了端到端純視覺的自動駕駛系統FSD V12,所有北美車主用戶,都OTA更新升級,可以實現所有道路場景的任意點到點AI駕駛。

SpaceX則完成了第三次星艦發射,雖然最后功敗垂成,但又史無前例地邁進了一大步。

推特則開源了推薦算法,然后迎來了一波自然流量新高峰。

別人都是 you can you up, no can no bb…馬斯克不一樣,bb up不選擇,邊喊邊干,還都干成了。

參考鏈接:
[1]https://github.com/xai-org/grok-1。
[2]https://x.ai/blog/grok-os。

責任編輯:姜華 來源: 量子位
相關推薦

2024-03-19 14:00:59

2024-03-18 08:47:34

馬斯克GrokOpenAI

2024-03-18 10:17:00

開源AI

2024-03-18 14:17:06

大模型開源人工智能

2023-12-13 08:46:33

人工智能ChatGPT機器人

2023-11-06 12:34:14

模型訓練

2022-04-27 07:16:52

收購馬斯克推特

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2023-08-03 19:11:45

2024-03-18 13:21:13

2025-02-11 11:19:52

2025-07-03 08:50:20

2023-12-12 17:53:27

馬斯克AIChatGPT

2025-02-21 10:51:47

2022-07-11 09:44:28

推特馬斯克收購

2022-12-28 15:35:58

馬斯克推特

2025-03-21 09:50:56

2022-04-15 14:36:39

馬斯克推特

2024-03-29 12:48:00

數據訓練

2022-01-23 10:53:47

星鏈互聯網衛星
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人精品鲁一区一区二区 | 狠狠狠干| 国产精品区二区三区日本 | 高清一区二区三区 | 国产精品久久国产精品久久 | 亚洲福利一区 | 人人做人人澡人人爽欧美 | 国产精品久久国产精品 | 亚洲国产精品久久 | 欧美日韩国产精品一区 | 在线观看中文字幕一区二区 | 欧美日韩亚洲视频 | 天天久| 精品成人av | 最新中文字幕一区 | 久久久久一区二区三区 | 精品一区二区三区在线视频 | 一区二区三区免费 | 久久99精品久久久久 | 国产成人精品久久二区二区91 | 免费一级网站 | 久久国产免费 | 欧美性影院 | 亚洲欧美国产一区二区三区 | aacc678成免费人电影网站 | 国产精品一区二区av | 在线成人一区 | 国产一级免费在线观看 | 久久精品小视频 | 久久久精品日本 | 午夜精 | 91精品国产综合久久久动漫日韩 | 国内精品免费久久久久软件老师 | 亚洲欧洲激情 | a在线观看 | 久久久久中文字幕 | 成人h视频在线 | 久久一区 | 成人在线精品 | 久久久www成人免费精品 | 亚洲一区二区三区在线 |