成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Stability AI發布Stable Code 3B模型,沒有GPU也能本地運行

人工智能 新聞
Stable Code 3B 的性能優于類似大小的代碼模型,并且與 CodeLLaMA 7B 的性能相當,盡管其大小只有 CodeLLaMA 7B 的 40%。

在文生圖領域大火的 Stability AI,今天宣布了其 2024 年的第一個新 AI 模型:Stable Code 3B。顧名思義,Stable Code 3B 是一個擁有 30 億參數的模型,專注于輔助代碼任務。 

無需專用 GPU 即可在筆記本電腦上本地運行,同時仍可提供與 Meta 的 CodeLLaMA 7B 等大型模型具有競爭力的性能。

2023 年底,Stability AI 便開始推動更小、更緊湊、更強大模型的發展,比如用于文本生成的 StableLM Zephyr 3B 模型。

隨著 2024 年的到來,Stability AI 開年便馬不停蹄的發布 2024 年第一個大型語言模型 Stable Code 3B,其實這個模型早在去年八月就發布了預覽版 Stable Code Alpha 3B,此后 Stability AI 一直在穩步改進該技術。新版的 Stable Code 3B 專為代碼補全而設計,具有多種附加功能。

與 CodeLLaMA 7b 相比,Stable Code 3B 大小縮小了 60%,但在編程任務上達到了與前者相媲美的性能。

Stable Code 3B 在 MultiPL-E 基準上實現了 SOTA 性能(與類似大小的模型相比),例如 Stable Code 3B 在 Python、C++、JavaScript、Java、PHP 和 Rust 編程語言上的性能優于 StarCoder。

圖片

研究介紹

Stable Code 3B 基于 Stable LM 3B 訓練而成,而 Stable LM 3B 訓練 token 數達到 4 萬億,更進一步的,Stable Code 使用了軟件工程中特定的數據(包括代碼)進行訓練。

Stable Code 3B 提供了更多的特性,即使跨多種語言也表現良好,還兼具其他優勢,比如支持 FIM(Fill in the Middle ,一種新的訓練技巧)功能,還能擴展上下文大小。基礎 Stable Code 在多達 16,384 個 token 序列上進行訓練,遵循與 CodeLlama 類似的方法,即采用旋轉嵌入(Rotary Embeddings),這種方法可以選擇性的允許修改多達 1,000,000 個旋轉基(rotary base),進一步將模型的上下文長度擴展到 100k 個 token。

在模型架構方面,Stable Code 3B 模型是一個純解碼器的 transformer,類似于 LLaMA 架構,并進行了以下修改:

  • 位置嵌入:旋轉位置嵌入應用于頭嵌入維度的前 25%,以提高吞吐量;
  • Tokenizer:使用 GPTNeoX Tokenizer.NeoX 的修改版本,添加特殊 token 來訓練 FIM 功能,例如 < FIM_PREFIX>、<FIM_SUFFIX > 等。

訓練

訓練數據集

Stable Code 3B 的訓練數據集由 HuggingFace Hub 上提供的開源大規模數據集過濾混合組成,包括 Falcon RefinedWeb、CommitPackFT、Github Issues、StarCoder,并進一步用數學領域的數據補充訓練。

訓練基礎設施

  • 硬件:Stable Code 3B 在 Stability AI 集群上使用 256 個 NVIDIA A100 40GB GPU 進行訓練。
  • 軟件:Stable Code 3B 采用 gpt-neox 的分支,使用 ZeRO-1 在 2D 并行性(數據和張量并行)下進行訓練,并依賴 flash-attention、SwiGLU、FlashAttention-2 的旋轉嵌入內核。

最后,我們看一下 Stable Code 3B 的性能表現:

關于 Stable Code 3B 更詳細的技術報告會在之后發布,大家可以期待一下。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-01-17 13:32:46

AI代碼代碼生成工具

2024-03-29 12:43:15

精度代碼模型

2024-03-27 09:09:57

模型AI開源

2024-10-17 18:52:41

2023-08-09 11:53:55

AI編程工具

2024-06-04 14:09:00

2024-02-05 13:24:51

GPUNLP芯片

2025-05-27 08:30:00

AI多模態模型VLR1-3B

2024-03-05 11:31:00

AI數據

2024-06-13 09:12:48

2025-03-13 06:34:49

2025-02-07 11:00:00

模型開源AI

2025-03-13 07:30:00

谷歌Gemma 3AI 模型

2025-04-03 00:10:11

DockerAI模型

2025-02-25 12:30:00

2024-03-25 00:03:00

生成式 AIAI

2024-11-04 08:00:00

2025-03-19 08:00:00

2023-02-10 21:12:41

GPUmacOSStable
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美黑人国产人伦爽爽爽 | 亚洲精品黄色 | 欧美视频三级 | 91精品国产欧美一区二区成人 | 成人国产精品久久久 | h视频免费观看 | 一区二区三区中文字幕 | 欧美色a v| 四虎影| 亚洲一区二区三区四区av | 国产999精品久久久久久 | 日本不卡一区 | 欧美日韩综合一区 | 亚洲综合五月天婷婷 | 日韩a级片| 精品国产一区二区三区久久狼黑人 | 伊人一区| 日本三级电影在线观看视频 | 欧美老少妇一级特黄一片 | 精品欧美一区二区中文字幕视频 | 一级黄色毛片 | 在线欧美视频 | 国产视频精品区 | 一区二区三区视频在线观看 | 日本三级日产三级国产三级 | 欧美激情网站 | a级毛片基地 | 久久久久久久久久久高潮一区二区 | 中文字幕日韩欧美一区二区三区 | 欧美一区二区激情三区 | 日本久久一区 | 国产 日韩 欧美 在线 | 91亚洲欧美 | 日本成人区 | 欧美精品第一区 | 成人黄色在线视频 | 午夜精品一区二区三区在线观看 | 成人一区二区在线 | 黄色成人在线 | 成人国产精品免费观看视频 | 99国产精品视频免费观看一公开 |