拋開技術,從問題來串聯人工智能,機器學習和大模型技術 原創
“ 技術并不是一個一蹴而就的過程,而是一個逐漸發展的過程”
大模型火了也有兩年時間了,然后很多人也在不斷的學習大模型技術,但很多人一直沒學明白什么是大模型技術;他們所理解的大模型技術就是官方給出的大模型定義,但根本不知道為什么需要大模型技術,以及大模型為什么會是這個樣子。
今天,我們就拋開技術來思考一下,什么是大模型?
什么是大模型?
如果你問一個人什么是大模型,如果是一個技術人員他肯定會告訴你,大模型是一個擁有巨大參數量,并且需要經過大量數據訓練的神經網絡模型。
而如果是一個非技術人員,或者不了解大模型技術的人,他可能會告訴你大模型是一個很火的技術,是一種非常牛逼的人工智能技術。
OK,拋開專業的技術力量,上面的兩種說法都沒有錯;但如果讓你來回答這個問題,什么是大模型?把你自己的理解用語言給描述出來。現在開始思考一下,什么是大模型,你會怎么回答這個問題。也可以把你的理解打在評論區。
下面我們從非技術的角度開始,從問題開始,由淺入深的理解一下什么是大模型。
想理解什么是大模型,首先要理解大模型解決了什么問題;首先,大模型屬于人工智能的一個實現范疇,所以我們先從人工智能開始說起。
什么是人工智能?
人工智能簡單來說就是由人類制造出來的一個具有智能的機器或系統;也就是說人工智能是由人類制造出來的一個智能體。
為什么要制造這個智能體呢?拋開對技術的執念,單從智能體的作用來思考;有句話叫,技術發展的根本原因是因為人類的惰性,人類什么事都不想干,什么事都想讓機器去干。
但剛開始的機器只能由人類去操作才能完成一些事情,那么是否可以設計出一款可以自己思考,不需要人類干涉,然后就能主動去解決各種復雜問題的機器;這個機器就是人工智能。
ok現在目的已經很明確了,人類想設計出一款能夠自己思考,自己干活的機器,這樣就可以把人類從繁重的工作中解脫出來。
那么,怎么才能做出這樣的一個機器呢 ?也就是用什么樣的方案,才能達到這個目的?
科學家和一些技術人員經過多年的研究發現,想實現人工智能可能存在多種方式(人工智能有幾個流派,感興趣的可以去搜索一下);但目前最火的,也是最可能實現的人工智能技術就是——機器學習。
什么是機器學習?
既然一次性想實現一個人工智能很復雜,也很困難,那么是否可以模仿人類的成長過程一樣,通過學習的方式,讓機器慢慢具備智能;也就是讓機器去學習。
經過一段時間的研究,科學家們也提出了一些關于機器學習的想法,并實現了一些算法;比如樸素貝葉斯,邏輯回歸,決策樹等。
但科學家們發現,這些方式只能實現一些很簡單的“智能”,事實上根本算不上智能;那有沒有更好的辦法呢?
因此,經過仿生學的研究,科學家發現可以把實現人工智能與人類的腦科學結合起來;人類的思想很復雜,也很深邃,但核心部件就是我們的大腦;那能不能用一種方式去模仿人類的大腦,然后通過這種方式來實現人工智能呢?
因此,基于機器學習的深度神經網絡就出現了;什么是神經網絡?
所謂的神經網絡就是模仿人類的大腦神經元,用一種結構或算法去模仿人類的大腦運作方式,來讓機器具備自主學習的能力。
那神經網絡和大模型又有什么關系呢?
事實上,大模型是一種基于神經網絡架構的機器學習模型;因為人腦是一個非常復雜的系統,人腦中有幾百億神經元;因此,采用這種模仿人腦的神經網絡模型,就需要大量的參數來模仿不同的神經元;而模仿出大腦神經網絡之后,還要讓這個模型進行學習,因此就需要大量的數據讓它去理解,去學習。
因此,這種需要大規模的學習數據,基于神經網絡模型實現的機器學習模型,就叫做大模型。
現在大家應該了解了什么是大模型;那這個大模型具體怎么實現呢?這里可能有人會想,你這說的不是廢話嗎?前面剛說了模仿人類大腦神經元,現在又問怎么實現。
其實有這種問題也不奇怪,雖然說是模仿大腦神經元,那具體怎么模仿?這就類似于讓你模仿鳥類的飛行,來制造一個飛機出來;而飛機怎么制造?
制造飛機設計到動力系統,流體力學,材料學,控制系統等等多種學科;同樣,大模型也是如此;大模型設計到計算機科學,哲學,社會學,數學,物理學等等多種學科。
而且用機器去模仿人類的大腦,總要有一種結構吧;畢竟人腦也是有結構的;那么,怎么用一種結構或者說數學模型來模仿人類的大腦結構呢?
這時,讓chatGPT大放異彩的Transformer模型就出現了;當然,大模型并不只有Transformer這一種模型結構;還有其它多種模型結構,感興趣的也可以自己去搜索一下。
ok現在我們知道什么是大模型了,也知道了大模型的基礎結構之一的Transformer模型;那么,人類可以進行讀,寫,繪畫創作和邏輯推理等操作;那么怎么才能讓大模型也具備這種能力呢?
因此,這時就需要把大模型技術與自然語言處理技術相結合,這樣就可以讓大模型具備讀和寫的能力;而再把大模型與計算機視覺技術相結合,這樣大模型就具備了圖像和視頻處理的能力。
而邏輯推理是人類大腦最復雜也是最強大的一項能力,大模型無法直接實現類似人類思考推理的過程,但可以通過一種方式,那就是步驟拆解;讓大模型慢慢具備對簡單邏輯進行拆解的能力,然后使用這種方式,讓大模型把復雜的問題簡單化,讓好大模型就可以對簡單的問題進行處理;最后組合成一個能解決復雜問題的系統。
當然,大模型的技術目前還處于初級階段,它還處在一個不斷發展與完善的過程。但我們需要考慮的是,一是怎么把大模型做的更好,更強大;二是怎么讓大模型解決我們生活和工作中的問題;通過理論研究和實際應用的過程來不斷的提升和發展大模型的能力。
本文轉載自公眾號AI探索時代 作者:DFires
