成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<pre id="e22ma"><noscript id="e22ma"></noscript></pre>

<dfn id="e22ma"><delect id="e22ma"></delect></dfn>

<s id="e22ma"><dd id="e22ma"></dd></s>

<center id="e22ma"></center>

<abbr id="e22ma"><optgroup id="e22ma"></optgroup></abbr>

<abbr id="e22ma"><code id="e22ma"></code></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

OpenAI聯(lián)創(chuàng)Karpathy愛(ài)上羊駝：純C代碼實(shí)現(xiàn)嬰兒Llama2，MacBook可運(yùn)行，已攬1.6k星

作者：機(jī)器之心 2023-07-24 12:22:14

人工智能新聞

上個(gè)周末，Karpathy 花了整個(gè)周六來(lái)忙一個(gè) Llama2 的有趣項(xiàng)目。

這一周來(lái)，Meta 開(kāi)源的 Llama2 火遍了整個(gè) AI 社區(qū)。

這不，連特斯拉前 AI 總監(jiān)、年初重回 OpenAI 的 Andrej Karpathy 也坐不住了。他利用周末時(shí)間，做了一個(gè)關(guān)于 Llama2 的有趣項(xiàng)目 ——「llama2.c」。

圖片

GitHub 地址：https://github.com/karpathy/llama2.c

具體是什么呢？他表示「llama2.c」可以讓你在 PyTorch 中訓(xùn)練一個(gè) baby Llama2 模型，然后使用近 500 行純 C、無(wú)任何依賴性的文件進(jìn)行推理。并且，這個(gè)預(yù)訓(xùn)練模型能夠在 M1 芯片的 MacBook Air 上以 fp32 的浮點(diǎn)精度、18 tok/s 的速度對(duì)故事進(jìn)行采樣。

Karpathy 介紹稱，「llama2.c」的靈感來(lái)自 llama.cpp，后者由資深開(kāi)源社區(qū)開(kāi)發(fā)者 Georgi Gerganov 創(chuàng)建，可以在 MacBook 上使用 4-bit 量化運(yùn)行第一代 LLaMA 模型。

對(duì)于「llama2.c」，它的訓(xùn)練代碼由 nanoGPT 修改而來(lái)，用來(lái)訓(xùn)練 Llama2 架構(gòu)的模型。核心是在如下 run.c 中編寫 C 推理引擎，不過(guò)它目前并不是一個(gè)生產(chǎn)級(jí)庫(kù)。下面是部分推理代碼。

圖片

完整代碼地址：https://github.com/karpathy/llama2.c/blob/master/run.c

結(jié)果令 Karpathy 非常驚訝，你可以在（M1）CPU 的純單線程 C 語(yǔ)言中以 fp32 的交互速率來(lái)推理更小（O (~10MB)）的模型。

當(dāng)然，他表示自己沒(méi)有嘗試對(duì)最小規(guī)模的 Llama2 模型（70 億參數(shù)）進(jìn)行推理，他預(yù)計(jì)速度會(huì)非常慢。

圖片

目前，Karpathy 在 M1 MacBook Air 上，能夠以 fp32 的浮點(diǎn)精度、100tok/s 的速度對(duì) 15M 參數(shù)的 288 6 層 6 頭的模型進(jìn)行推理。

之后，Karpathy 對(duì)項(xiàng)目進(jìn)行了更新，使用「-O3」進(jìn)行編譯可以將 M1 MacBook Air 上的 tok/s 從 18 增加到了 98。這還沒(méi)完，使用「-funsafe-math-optimizations」進(jìn)行編譯更是將 tok/s 增加到 315。他表示，只要在 gcc 命令中包含更多字符，速度就能提升 17.5 倍。

也許你要問(wèn)了，這個(gè)項(xiàng)目有什么意義呢？在 Karpathy 看來(lái)，在一些較窄的領(lǐng)域（如生成故事）中，人們可以使用極其小的 Transformers 來(lái)做有趣的事情。

因此，這種可以移植的純 C 實(shí)現(xiàn)或許非常有用，我們可以通過(guò)簡(jiǎn)單的方法高交互速率地運(yùn)行合理大小的模型（幾千萬(wàn)參數(shù)）。

有網(wǎng)友對(duì)「llama2.c」的開(kāi)發(fā)過(guò)程很感興趣，很多人都會(huì)有這樣的想法，只是在等待合適的時(shí)機(jī)，他們沒(méi)意識(shí)到幾天內(nèi)就可以完成很多工作。

Karpathy 回復(fù)稱，自己對(duì)利用 float32 權(quán)重塊及其上的微小推理代碼來(lái)生成故事非常感興趣。所以他花了整個(gè)周六的時(shí)間（從起床一直到睡覺(jué)）來(lái)寫代碼，然后讓項(xiàng)目工作。

圖片

此外，Karpathy 還表示自己將出講解視頻。

圖片

項(xiàng)目詳情

到目前為止，「llama2.c」項(xiàng)目已經(jīng)在 GitHub 上獲得了 1.6k 的 Stars，并在快速增長(zhǎng)。

圖片

下面簡(jiǎn)單介紹一下該項(xiàng)目的運(yùn)行步驟。

為了使用純 C 語(yǔ)言運(yùn)行一個(gè) baby Llama2 模型，你需要以下的模型檢查點(diǎn)。下載 TinyStories 數(shù)據(jù)集上訓(xùn)練的一個(gè) 15M 參數(shù)的模型（大約 58MB），并將它放入默認(rèn)檢查點(diǎn)目錄中。

wget https://karpathy.ai/llama2c/model.bin -P out

然后編譯并運(yùn)行 C 代碼。

gcc -O3 -o run run.c -lm
./run out/model.bin

請(qǐng)注意這只是原始 tokens 流。遺憾的是，我們現(xiàn)在必須通過(guò)一個(gè)簡(jiǎn)單的轉(zhuǎn)換封裝器來(lái)運(yùn)行 C 代碼（只有 30 行）。

pip install sentencepiece
python run_wrap.py

最后你將看到文本流。在 Karpathy 的 M1 MacBook Air 上，運(yùn)行速度約 100 tok/s，對(duì)于超級(jí)原生的 fp32 單線程 C 代碼來(lái)說(shuō)還不錯(cuò)。示例輸出如下所示。

圖片

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：亚洲一二三视频 | 国产精品亚洲一区 | 欧美一级精品片在线看 | 天天操网 | 日日草夜夜草 | 奇米久久久 | 日日日色 | 2018国产大陆天天弄 | 欧美精品一区二区三区四区在线 | 亚洲第一在线 | 九九九久久国产免费 | 91香蕉嫩草| 九九热精品视频 | 91极品欧美视频 | 99tv成人影院 | 午夜视频网站 | 精品久久久久久久久久久院品网 | 精品一级 | 国产精品久久久久久久午夜片 | 日韩av一区二区在线观看 | 精品毛片 | 一区二区三区中文字幕 | 成人一区二区三区在线观看 | 日本成人综合 | 日韩中文字幕免费在线 | 超碰成人免费观看 | 亚洲精品久久久 | 97精品超碰一区二区三区 | 亚洲精品一区二区三区在线 | 91综合网| 嫩呦国产一区二区三区av | 欧美精品一区二区三区四区在线 | 国产精品久久久久久久久久久久 | 成人h动漫精品一区二区器材 | 国产激情一区二区三区 | 国产精品一区二区三区四区 | 免费a v网站 | 91久久综合亚洲鲁鲁五月天 | 亚洲男人天堂 | 亚洲最大福利网 | 精品久久久久久久 |

<abbr id="oygw8"><code id="oygw8"></code></abbr>

<s id="oygw8"></s>

<samp id="oygw8"><noscript id="oygw8"></noscript></samp>

<bdo id="oygw8"><strong id="oygw8"></strong></bdo>