成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

3140參數Grok-1推理加速3.8倍,PyTorch+HuggingFace版來了

人工智能 新聞
Grok-1使用Rust+JAX構建,對于習慣Python+PyTorch+HuggingFace等主流軟件生態的用戶上手門檻高。

馬斯克說到做到開源Grok-1,開源社區一片狂喜。

但基于Grok-1做改動or商用,都還有點難題:

Grok-1使用Rust+JAX構建,對于習慣Python+PyTorch+HuggingFace等主流軟件生態的用戶上手門檻高。

圖片

△圖注:Grok登上GitHub熱度榜世界第一

Colossal-AI團隊最新成果,解大家燃眉之急,提供方便易用的Python+PyTorch+HuggingFace Grok-1,能將推理時延加速近4倍

現在,模型已在HuggingFace、ModelScope上發布。

HuggingFace下載鏈接:
https://huggingface.co/hpcai-tech/grok-1

ModelScope下載鏈接:
https://www.modelscope.cn/models/colossalai/grok-1-pytorch/summary

性能優化

結合Colossal-AI在AI大模型系統優化領域的豐富積累,已迅速支持對Grok-1的張量并行。

在單臺8H800 80GB服務器上,推理性能相比JAX、HuggingFace的auto device map等方法,推理時延加速近4倍

圖片

使用教程

下載安裝Colossal-AI后,啟動推理腳本即可。

./run_inference_fast.sh hpcaitech/grok-1

模型權重將會被自動下載和加載,推理結果也能保持對齊。如下圖中Grok-1 greedy search的運行測試。

圖片

更多詳情可參考grok-1使用例:
https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/grok-1

龐然大物Grok-1

此次開源,xAI發布了Grok-1的基本模型權重和網絡架構。

具體來說是2023年10月預訓練階段的原始基礎模型,沒有針對任何特定應用(例如對話)進行微調。

結構上,Grok-1采用了混合專家(MoE)架構,包含8個專家,總參數量為314B(3140億),處理Token時,其中的兩個專家會被激活,激活參數量為86B。

單看這激活的參數量,就已經超過了密集模型Llama 2的70B,對于MoE架構來說,這樣的參數量稱之為龐然大物也毫不為過。

更多參數信息如下:

  • 窗口長度為8192tokens,精度為bf16
  • Tokenizer vocab大小為131072(2^17),與GPT-4接近;
  • embedding大小為6144(48×128);
  • Transformer層數為64,每層都有一個解碼器層,包含多頭注意力塊和密集塊;
  • key value大小為128;
  • 多頭注意力塊中,有48 個頭用于查詢,8 個用于KV,KV 大小為 128;
  • 密集塊(密集前饋塊)擴展因子為8,隱藏層大小為32768

圖片

在GitHub頁面中,官方提示,由于模型規模較大(314B參數),需要有足夠GPU和內存的機器才能運行Grok。

這里MoE層的實現效率并不高,選擇這種實現方式是為了避免驗證模型的正確性時需要自定義內核。

模型的權重文件則是以磁力鏈接的形式提供,文件大小接近300GB。

圖片

值得一提的是,Grok-1采用的是Apache 2.0 license,商用友好

目前Grok-1在GitHub上的標星已達到43.9k Stars。

量子位了解,Colossal-AI將在近期進一步推出對Grok-1在并行加速、量化降低顯存成本等優化,歡迎持續關注。

Colossal-AI開源地址:https://github.com/hpcaitech/ColossalAI

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-18 08:47:34

馬斯克GrokOpenAI

2024-06-28 13:42:07

2024-03-18 10:17:00

開源AI

2024-03-18 15:00:48

Grok現已開源Grok-1混合專家模型

2024-01-24 13:11:00

AI模型

2024-03-28 12:53:00

AI數據

2025-01-08 13:15:02

2024-07-19 09:59:31

2024-03-19 14:00:59

2019-09-02 14:58:03

深度學習編程人工智能

2023-12-11 15:40:32

PyTorch代碼大模型

2025-06-11 09:15:51

2025-06-30 08:42:00

模型訓練AI

2024-11-25 08:30:00

2023-12-03 08:49:38

微軟開源

2023-09-01 15:22:49

人工智能數據

2024-07-08 13:04:01

2023-11-30 18:25:57

數據訓練

2023-06-21 13:20:14

系統模型

2024-12-26 16:00:00

英特爾推理模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 六月婷婷久久 | 91免费视频 | 国产精品久久久久久久久久 | 美女久久视频 | 欧美一区2区三区4区公司 | 国产精品欧美一区二区三区 | 91麻豆蜜桃一区二区三区 | 日韩中文在线视频 | 亚洲激情av| 国产精品久久久久久久久久 | 日韩精品一区二区在线 | 国产成人一区在线 | 国产成人a亚洲精品 | 国产网站在线免费观看 | 成人在线视频网址 | 国产视频中文字幕 | 日本高清中文字幕 | 国产91在线 | 亚洲 | av资源在线看 | 欧美午夜视频 | 中文字幕欧美在线观看 | 日韩电影中文字幕在线观看 | 在线免费亚洲视频 | 一区二区不卡视频 | 亚洲精品一区中文字幕乱码 | 免费毛片www com cn | 欧美不卡一区二区 | 日韩欧美高清 | 在线国产一区二区 | 日本电影一区二区 | 超碰免费观看 | 365夜爽爽欧美性午夜免费视频 | 麻豆视频在线看 | 三级视频国产 | 日本不卡一区二区三区在线观看 | 日韩欧美在 | 亚洲精品久久嫩草网站秘色 | 天天综合网7799精品 | 国产一级片在线播放 | 天天艹日日干 | 精品久久一区 |