最近一段時間關于大模型技術的學習及應用的心得體會 原創
“ 怎么把大模型的各種技術與應用場景相結合是一個值得思考的問題”
今天這篇文章應該算是對這幾個月以來學習和應用大模型技術的總結,也可以說是這段時間的心得體會。
今天主要從技術與應用兩個方面來講,當然也會夾雜著一些自己的理解與想法。
關于大模型技術的學習與應用及心得體會
對任何一項技術來說,主要有兩個方面,其一是技術面,其二是應用面;技術本質只是一個工具,也就是我們常說的,技術是為業務服務的。
一項新技術的出現,要么在新技術上構建新的應用,要么就用新技術去解決舊問題。
而大模型技術是最近兩年爆火的一項技術,因為它使得人工智能技術得到了巨大的進步,使得人工智能不僅僅只是一個理念,而是真正成為一個有可能實現的目標。
技術面
在前面說技術的本質是工具,因此從技術的角度來說,技術的作用就是怎么把這個工具做得更好。
我們經常說大模型技術,其實大模型是人工智能技術的一個分支——機器學習技術深化后產生的深度學習技術所開發的一款產品或者說工具。
因此,關于大模型的“技術”研究的都是怎么把模型這個工具做的更好,比如說不同架構的神經網絡,訓練方式,微調方式;再具體的比如,Transformer架構,前向傳播,反向傳播,損失計算等等;再有如遷移學習,強化學習,對抗網絡等無外如是。
怎么把大模型做得更好,更快,更好用,重不重要?
重要,但受限于大模型的本身的技術復雜度和成本問題,對絕大部分人和企業來說,大模型巨大的資金和技術成本都是不可接受的,也就是說大模型這個技術不是一般人和一般企業能夠玩得轉的。
從我的個人的角度來說,大模型技術要不要學?
要學,因為它是未來發展的方向,但學到什么程度就是一個值得思考的問題了。
如果說你就癡迷于技術無法自拔,或者說你對技術有著強烈的好奇心和驅動力,那么你可以選擇深入研究大模型的技術,比如深度學習網絡,反向傳播算法等等。
而對大部分人來說,只需要了解大模型的基本原理,以及了解大模型的訓練與微調,能夠根據具體的業務場景微調出一個能夠解決實際問題的模型就可以了。
工具是一個不斷發展和進化的過程,因此必須要有人去研究把一個大模型做的更好的技術,只有這樣才不會讓大模型技術停滯不前。
從這段時間的學習來看,在之前發表的文章中基本上已經涵蓋了大模型絕大部分技術理念。
總之一句話,關于大模型的技術目的只有一個,那就是把模型做得更好。
應用面
從應用的層面來說,目前大模型的主要應用有以下幾個方向:
- AIGC
- Agent
- 知識庫
AIGC可以說是大模型技術的主要應用方向之一,也是出現比較早的應用場景,因為現在的大模型就叫做生成式人工智能,而AIGC就是內容生成的領域。
從技術的角度來說,AIGC就是利用大模型的生成能力,來生成各種文字,圖片,視頻,音頻,PPT等各種內容形式,而技術需要解決的問題就是讓大模型在不同的領域表現更好。
而Agent的應用范圍就更加寬泛,比如一些工作流,也包括自動駕駛技術,工業生成等方向。
Agent就是利用各種環境感知能力,然后利用大模型做出合理和準確的判斷,然后做出正確的決策并執行,執行的過程是通過調用外部工具的方式來實現。
而Agent的核心技術就是大模型的推理和規劃能力,具體來說就是利用提示詞和思維鏈,以及外部工具,讓大模型能夠做到獨立思考和判斷,學會拆解問題和目標,并使用工具解決問題的過程。
而知識庫技術是對大模型技術缺陷的補充,有了知識庫就可以解決大模型知識不足的問題,并且可以大大降低大模型的缺陷——幻覺問題。
而知識庫主要涉及的技術是知識庫的搭建,檢索,存儲;也就是讓大模型更好的理解外部知識,主要技術載體就是RAG——檢索生成增強。
從技術的角度來說,大模型主要涉及的技術就以上幾個方面;而從應用角度來說,大模型的應用更多的是靠想象力,而不是技術。
大模型的技術就那么多,而怎么利用這些技術構建更加好用與合理化的應用是一個值得思考的問題。
本文轉載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/8QyPNaTLWbQ2W8zup4VJ-w??
