成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

“Transformer挑戰(zhàn)者”Mamba,用Macbook也能跑了!GitHub半天斬獲500+星

人工智能
Mamba是一種新的大模型架構(gòu),在語(yǔ)言任務(wù)上的表現(xiàn)可以與兩倍規(guī)模的Transformer一決雌雄。但官方給出的只有模型文件,需要一定專業(yè)知識(shí)才能部署使用,而且要Linux+N卡才能運(yùn)行。

“Transformer的挑戰(zhàn)者”Mamba,用MacBook也能跑了!

有大佬在GitHub上共享了一份筆記,讓人們可以用最簡(jiǎn)單的方式運(yùn)行Mamba。

這份共享中,算上說(shuō)明書(shū)一共只有三個(gè)文件,而且發(fā)布不到一天,就斬獲了500+星標(biāo)。

圖片圖片

Mamba是一種新的大模型架構(gòu),在語(yǔ)言任務(wù)上的表現(xiàn)可以與兩倍規(guī)模的Transformer一決雌雄。

但官方給出的只有模型文件,需要一定專業(yè)知識(shí)才能部署使用,而且要Linux+N卡才能運(yùn)行。

圖片圖片

有了這份筆記,Mamba的運(yùn)行步驟大大簡(jiǎn)化,而且也不再要求N卡,M系列的MacBook也能跑了。

從事相關(guān)專業(yè)的網(wǎng)友看了表示,這種簡(jiǎn)單化的模型實(shí)在是太棒了,希望自己的工作也能朝著這個(gè)方向進(jìn)展。

圖片圖片

原版Mamba的作者Tri Dao和Albert Gu也轉(zhuǎn)發(fā)了這份筆記,并對(duì)它的簡(jiǎn)潔性和易讀性給予了肯定。

圖片圖片

那么,這份筆記該如何使用呢?

兩個(gè)文件即可運(yùn)行

首先,打開(kāi)一個(gè)能運(yùn)行PyTorch筆記的工具,比如Jupyter、VSCode,或者在線的谷歌Colab等。

然后下載作者的筆記和Python腳本,用Colab的話也可以使用GitHub導(dǎo)入功能。

如果在本地運(yùn)行,需要把兩個(gè)文件放到同一個(gè)目錄;如果用Colab,則需要在連接成功后把model.py上傳。

如果不上傳,會(huì)出現(xiàn)“找不到‘model’”的報(bào)錯(cuò)如果不上傳,會(huì)出現(xiàn)“找不到‘model’”的報(bào)錯(cuò)

之后是安裝所需的依賴環(huán)境,Colab需要手動(dòng)安裝的是einops,其他工具可以根據(jù)報(bào)錯(cuò)信息判斷缺少的依賴。

!pip install 需要安裝的依賴名稱

圖片圖片

解決好依賴問(wèn)題后,就可以點(diǎn)擊筆記第一組中的運(yùn)行按鈕了,這里可以對(duì)模型規(guī)模進(jìn)行選擇,默認(rèn)370M。

圖片圖片

接下來(lái)是初始化,直接點(diǎn)擊運(yùn)行按鈕即可。

這里也可以對(duì)輸出token的數(shù)量進(jìn)行調(diào)節(jié),默認(rèn)是50。

圖片圖片

接著,筆記中給出了一些實(shí)例,我們也可以修改單引號(hào)之間的prompt內(nèi)容(換行用\n表示),然后點(diǎn)擊運(yùn)行。

不過(guò)需要注意的是,這里的prompt和我們平時(shí)用ChatGPT等bot型應(yīng)用的方式有所區(qū)別。

圖片圖片

這里可以借用一下Hugging Face中Llama 2的系統(tǒng)提示詞:

Below are a series of dialogues between various people and an AI assistant. The AI tries to be helpful, polite, honest, sophisticated, emotionally aware, and humble-but-knowledgeable. The assistant is happy to help with almost anything, and will do its best to understand exactly what is needed. It also tries to avoid giving false or misleading information, and it caveats when it isn’t entirely sure about the right answer. That said, the assistant is practical and really does its best, and doesn’t let caution get too much in the way of being useful.User: 想問(wèn)的問(wèn)題Assistant:

圖片圖片

性能上,在默認(rèn)的規(guī)模和輸出長(zhǎng)度(370M,50token)下,輸入Once Upon a time,在純CPU版Colab中需用時(shí)約1分鐘,在TPU上的用時(shí)則約為30秒,內(nèi)存消耗在3到4GB之間。

圖片圖片

在M1芯片的Mac上,以相同設(shè)置處理同樣的內(nèi)容,則需花費(fèi)1分半左右。

圖片圖片

不過(guò)作者也解釋道,出于易讀性的考慮,去掉了原版Mamba中的一些加速指令。

圖片圖片

參考鏈接:https://news.ycombinator.com/item?id=38708730

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2024-04-26 16:44:50

2011-02-23 09:35:58

Mozilla火狐瀏覽器

2024-08-13 12:49:29

2011-11-07 09:02:52

諾基亞Windows Pho

2013-03-25 12:37:56

2013Android競(jìng)爭(zhēng)對(duì)手

2015-02-02 11:31:33

聯(lián)想摩托羅拉

2015-04-27 15:05:28

2024-08-19 13:21:14

2018-07-23 13:48:47

京東云

2018-10-31 09:43:22

2013-08-30 09:06:17

公有云AWSIBM

2012-03-29 09:13:52

Windows Pho挑戰(zhàn)賽

2023-02-20 15:26:52

游戲技術(shù)

2023-12-05 13:38:11

架構(gòu)模型

2020-05-13 15:52:18

編碼競(jìng)賽網(wǎng)站代碼

2020-12-09 14:28:09

PON網(wǎng)絡(luò)通信服務(wù)

2012-04-16 13:21:00

2016-08-18 00:44:38

Python編程語(yǔ)言

2010-05-14 15:29:00

至強(qiáng)7500服務(wù)器評(píng)測(cè)

2024-01-02 10:17:07

AI論文
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品久久国产精品99 | 午夜精品 | 精品91久久| 色综合久久久久 | 91一区二区三区 | 中文字幕乱码一区二区三区 | 欧美日本一区二区 | 欧美99久久精品乱码影视 | 91深夜福利视频 | 国产精品久久久久久52avav | 亚洲精品国产第一综合99久久 | 久久久一区二区 | 亚洲成人一区二区 | 亚洲色图婷婷 | 91亚洲精品国偷拍自产在线观看 | 亚洲精品国产电影 | 中文在线视频观看 | 国产精品久久久久久中文字 | 91视频www.| 亚洲精品一区在线观看 | 国产亚洲精品美女久久久久久久久久 | 国产三区av| 美女久久久久 | 日韩精品一区二区三区四区视频 | 精品国产一区二区在线 | 日韩视频一级 | 成人精品视频99在线观看免费 | 亚洲在线观看视频 | 久久久久久久久久久高潮一区二区 | 亚洲精品福利视频 | 国产乱码精品一区二区三区五月婷 | 欧美精品久久久久久久久老牛影院 | 日韩欧美中文 | 欧美在线观看一区 | 欧美午夜视频 | 99亚洲精品 | 国产视频精品在线观看 | 日本不卡一区二区三区在线观看 | 免费一级欧美在线观看视频 | 黄视频免费观看 | 丝袜 亚洲 另类 欧美 综合 |