當你研究過了900個開源大模型項目后,你能學(xué)到什么? 原創(chuàng)
國外一美女程序員,在Github上通過檢索gpt, llm, 和generative ai等關(guān)鍵字,從數(shù)十萬檢索結(jié)果中得到900個500+ star大模型開源項目。
她將統(tǒng)計結(jié)果放到了網(wǎng)站上,并定期更新star數(shù)等信息,同時提供了排序,分組,過濾等工具,我們也可以拿她的統(tǒng)計結(jié)果來進行分析。
??https://huyenchip.com/llama-police??
接下來讓我們看看她通過分析這些開源項目學(xué)到了什么。
新的AI堆棧
基礎(chǔ)設(shè)施包括訓(xùn)練大模型的硬件資源,訓(xùn)練大模型需要大量的顯卡,一些企業(yè)考慮到數(shù)據(jù)安全,以及從長遠成本考慮,選擇搭建自己的計算中心。NVIDIA這幾年靠著賣顯卡可謂賺的盆滿缽滿,顯卡價格一路飆升,即使這樣仍是一卡難求。
模型開發(fā)工具包括像TensorFlow、PyTorch等AI框架,框架本身是開源免費的,但可以通過附加的云服務(wù)和硬件資源來賺錢。
應(yīng)用軟件指的是基于大模型的工具,一般通過閉源大模型有償向用戶提供訪問接口,例如,openAI每個月都會向Plus用戶收取會員費以及API調(diào)用費用。
隨時間變化
圖表顯示,當chatGPT發(fā)布后,大模型的相關(guān)項目數(shù)量開始呈指數(shù)級增長。
這說明當一項顛覆性技術(shù)出現(xiàn)后,圍繞此技術(shù)的各項發(fā)明會迅速增加。
就像當年的電力。
但大家會有疑問,大模型也就能畫個圖,寫寫小作文,說它是顛覆性技術(shù),有點過了吧?
當年電力取代蒸汽機時,一開始人們對于電機也是持懷疑態(tài)度,因為它并沒有提高生產(chǎn)效率。
后來人們才發(fā)現(xiàn),是使用方法不當。
在傳統(tǒng)工廠的中間會有一個蒸汽機,然后通過傳動裝置驅(qū)動各個模塊,有了電機后只是簡單的將蒸汽機替換成了電機。
本質(zhì)上還是個集中式系統(tǒng),依據(jù)木桶原理,整體效率仍然受限于最差的那個。
后來,工廠將電機應(yīng)用于各個模塊,這就是現(xiàn)代工廠流水線的雛形,這樣的分布式系統(tǒng)大大提升了效率
電開始普及開來。
在應(yīng)用層領(lǐng)域,項目最多的是code和bots。
code:當大模型在自然語言上取得成效后,人們開始將大模型應(yīng)用于人造語言上,代碼就是其中之一。
bots:相對被動式的一問一答,人們希望大模型能夠自主思考,會使用工具,并且嫩進行決策。
information aggregation:科技的進步只是將人類從繁重的體力勞動中解放出來,人們要學(xué)的東西日益增多,大模型的概括能力讓人具有一目十行的超能力。
專注Prompt工程的人,我認為是最聰明的人,因為它是性價比最高的提升大模型性能的方法。
前面我也通過兩個例子證明了Prompt工程的超能力,僅僅通過在Prompt前面加個think step by step,就讓大模型答對了9.11和9.3哪個大的問題,以及strawberry有多少個r的問題。
本文轉(zhuǎn)載自公眾號人工智能大講堂
原文鏈接:??https://mp.weixin.qq.com/s/QWGyhYHonybE2F6iomJb8w??
