成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT開源平替來了,開箱即用!前OpenAI團隊打造,GitHub剛發布就攬獲800+星

人工智能 新聞
GitHub剛剛上線,就已經獲得了800+標星。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

ChatGPT的開源平替來了,源代碼、模型權重和訓練數據集全部公開。

它叫OpenChatKit,由前OpenAI研究員共同打造。

圖片

效果是這樣兒的:

可以用簡單的語言解釋機器學習的概念,也可以回答測試者提出的第二個小問題。

信息提取也難不倒它,比如將一大段計劃用表格表示。

圖片

據悉,OpenChatKit一共包含200億參數,在EleutherAI的GPT-NeoX-20B(GPT-3開源替代品)上進行了微調,還可以連接其它API或數據源進行檢索等等。

這不,GitHub剛剛上線,就已經獲得了800+標星。

圖片

有網友感嘆“事情進展得也太快了吧”,作者則回應: 

安全帶系緊,享受“飆車”吧。

來看看它具體怎么玩?

OpenChatKit,你的平替ChatGPT

據介紹,OpenChatKit一共包含4個基本組件:

1、一個指令調優的大型語言模型。

用EleutherAI的GPT-NoX-20B對聊天功能進行了微調,后者在carbon-negative計算上具有4300萬條指令。

調整重點是多輪對話、問答、分類、提取和摘要等幾個任務。

2、定制配方(recipe)。

用來幫助微調模型使其能夠為特定任務提供高精度的結果,只需要準備自己的數據集。

3、一個可擴展的檢索系統。

可以讓你在推理時從文檔存儲庫、API或其他實時更新信息源添加信息。

圖片

4、一個由GPT-JT-6B微調而成的調節模型(moderation model)??梢赃^濾模型對一些問題的響應。

這樣的OpenChatKit可以為各種應用程序創建專用和通用的聊天機器人。

在GitHub上的倉庫,你可以找到它的訓練代碼、測試推理代碼以及通過檢索增強模型的代碼。

具體如何使用?

首先,在開始之前,安好PyTorch和其他依賴項。

先從作者團隊的網站(Together)安裝Miniconda,然后用此repo根目錄下的environment.yml文件創建一個名為OpenChatKit的環境。

由于repo使用Git LFS來管理文件,所以還需要按照他們網站上的說明進行安裝,然后運行git lfs install。

接著,關于預訓練權重。

GPT-NeoXT-Chat-Base-20B是GPT NeoX的200億參數變體,它在會話數據集上進行了微調。

作者在Huggingface上的GPT-Next-Chat-Base-20B發布了預訓練權重。

數據集方面,OpenChatKit模型是在LAION、Together和Ontocord.ai共同構建的OIG數據集上訓練的。

同樣,從Huggingface下載數據集,然后在repo的根目錄運行以下命令就行:

python data/OIG/prepare.py。

(你也可以貢獻新的數據來改善模型效果~)

然后就可以預訓練基礎模型了。

方法是在根目錄用以下命令下載GPT-NeoX-20B模型:

python pretrained/GPT-NeoX-20B/prepare.py。

它的權重放在pretrained/GPT-NeoX-20B/EleutherAI_gpt-neox-20b目錄中。

下載好之后,執行bash training/finetune_GPT-NeoXT-Chat-Base-20B.sh腳本,開始配置和訓練。

訓練會啟動8個進程,管道并行度為8,數據并行度為1。Checkpoints則將保存到repo根目錄的model_ckpts目錄中。

推理之前,請務必將模型轉換為Hugginface格式。

為了幫助你測試模型,作者也在這里提供了一個簡單的測試命令行工具來進行交互,執行命令:

python inference/bot.py。

默認情況下,腳本會在目錄下加載名為GPT-NeoXT-Chat-Base-20B model的模型,但我們可以通過—model進行改變。

都弄好之后,在提示符處輸入文本,模型就會回復了。

圖片

最后,作者還提供了一個用維基百科進行擴展搜索的例子,操作也比較簡單,感興趣的同學可以自行查看。

關于作者

OpenChatKit的歸屬單位叫Together。

這是一家去年7月才成立的創業公司,專門為AI行業做去中心化的云服務。

CEO是Vipul Ved Prakash,他曾在蘋果做了5年高級總監。

圖片

CTO是Zhang Ce,蘇黎世聯邦理工學院計算機專業的助理教授。

圖片

據推特博主Itamar Golan稱,OpenChatKit的作者包含多位前OpenAI研究員。

總的來說,OpenChatKit開箱即用,擅長多項任務,包括帶有上下文的總結和問題回答、信息提取、文本分類等。

但它還不太擅長創意寫作(尤其是編長故事)、寫代碼,以及有時可能會重復響應你的請求、在切換話題時表現遲鈍……

不過,正如Together在博客中說的那樣:

這個模型不是發布完就完了,它是一個開源項目的開始。

或許我們可以持續關注一波~

那么,如果你感興趣,傳送門在這里:

?https://github.com/togethercomputer/OpenChatKit?
?https://huggingface.co/spaces/togethercomputer/OpenChatKit

責任編輯:張燕妮 來源: 豐色
相關推薦

2023-10-13 13:12:27

2023-03-28 15:40:00

開發開源

2023-05-16 20:47:38

2023-04-02 21:39:14

ChatGPT開源

2024-10-28 12:54:36

2022-12-30 12:39:36

模型AI

2023-03-08 21:25:58

開源工具庫開箱

2023-05-19 07:35:03

ChatGPTOpenAI

2023-03-30 16:04:45

計算機訓練

2025-05-15 08:35:00

2024-11-29 07:00:00

Kimi大模型Mooncake

2024-11-18 10:25:00

AI模型

2023-03-03 07:34:05

2020-12-07 16:14:40

GitHub 技術開源

2023-04-04 10:09:09

2023-04-10 16:15:16

模型開源

2015-06-30 09:49:19

管理平臺開源KVM

2023-03-06 09:44:06

模型開源

2025-06-26 10:07:11

谷歌模型開源

2023-04-26 13:56:17

模型ChatGPT
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩精品一区二区 | 天天干天天草 | 中文字幕一区在线观看视频 | 精品日韩一区二区 | 一级黄色片毛片 | 日韩视频在线免费观看 | 亚洲午夜精品一区二区三区他趣 | 9999视频 | 欧美不卡网站 | 日韩国产中文字幕 | www.一区二区三区.com | 99久久精品免费看国产小宝寻花 | 色综合久久天天综合网 | 国产精品久久久 | 精品国产乱码久久久久久蜜退臀 | 精品乱码一区二区三四区视频 | 欧美99久久精品乱码影视 | 日韩中文字幕视频 | 一区二区三区欧美在线 | 中文字幕在线播放第一页 | 夜夜爽99久久国产综合精品女不卡 | 又爽又黄axxx片免费观看 | 中文字幕不卡视频在线观看 | 亚洲综合大片69999 | 一级欧美一级日韩片 | 日韩欧美在线观看 | 久久精品免费观看 | 欧美一区二区三区免费电影 | 日韩在线观看中文字幕 | 精品国产精品一区二区夜夜嗨 | 精品国产乱码久久久久久丨区2区 | 日日干综合| 久久国产精品-久久精品 | 欧美日韩在线精品 | 一级毛片免费看 | 成人高清在线视频 | 久久亚洲欧美日韩精品专区 | 午夜精品一区二区三区在线视 | 久久精品国产一区 | 天天操一操 | av中文字幕网站 |