為什么你會覺得大模型很難學(xué)?甚至學(xué)了好久還不知道大模型到底是個(gè)什么玩意? 原創(chuàng)
“ 先從簡單的開始,而不是從復(fù)雜的開始;簡單意味著成就感,復(fù)雜意味著挫敗感 ”
理論是來自于現(xiàn)實(shí)中的實(shí)踐結(jié)果,理論來自于實(shí)踐,驗(yàn)證于實(shí)踐;單純的理論是沒有生存空間的。
為什么你覺得大模型很難?甚至覺得學(xué)不會大模型?
原因就在于你太沉迷于理論,而忽略了實(shí)踐的意義。
大模型不是一個(gè)純理論的科學(xué)
大模型技術(shù)并不是一個(gè)純粹的理論科學(xué),而是一個(gè)具有較強(qiáng)實(shí)踐性的實(shí)踐科學(xué)。
我們有很多人在學(xué)習(xí)大模型技術(shù)的過程中,覺得大模型好難,好抽象,看了好多書和視頻,最后還是記不清楚大模型是什么。原因何在?
原因就是他們沉迷于理論無法自拔,理論是對實(shí)踐結(jié)果的抽象和總結(jié);只重視理論的結(jié)果只有一個(gè),那就是眼高手低,說什么都懂,做什么都錯(cuò)。
當(dāng)然說這些話并不是說理論不重要,而是說理論要于實(shí)踐相結(jié)合才能發(fā)揮更大的威力;理論和實(shí)踐就是硬幣的一體兩面,誰離了誰都沒有生存的空間以及存在的意義。
比如說很多人學(xué)習(xí)大模型的時(shí)候,看到網(wǎng)上的一些文章或視頻,就覺得學(xué)習(xí)大模型要學(xué)習(xí)機(jī)器學(xué)習(xí)理論,Transformer架構(gòu),各種算法,向量處理等。
然后就硬著頭皮買幾本書或找?guī)讉€(gè)視頻開始深入研究,然后沒過幾天就放棄了,原因是覺得這玩意太難了,看又看不懂,學(xué)又學(xué)不會。
作為一個(gè)正常人,我想絕大部分人看著大模型技術(shù)中的理論架構(gòu)和數(shù)學(xué)算法都會頭疼,原因就是你跑偏了,沒有弄清楚事情的本質(zhì)。
你學(xué)習(xí)的是大模型技術(shù),而不是來學(xué)習(xí)數(shù)學(xué)的,而且數(shù)學(xué)算法只是實(shí)現(xiàn)大模型技術(shù)的一種方式即使不懂?dāng)?shù)學(xué),也不耽誤你學(xué)習(xí)大模型;原因就是,有幾個(gè)司機(jī)知道汽車是怎么造出來的嗎?因?yàn)樗麄兏静恍枰溃恍枰獣_就行。
同樣,數(shù)學(xué)和一些大模型理論對學(xué)習(xí)大模型來說,就像你去駕校學(xué)習(xí)開車;正常情況下是教練教你怎么踩油門,怎么打方向盤,怎么停車,怎么起步等等;然后在此基礎(chǔ)之上,你自己開幾年車之后,期間會遇到各種各樣的問題,這時(shí)你自己就會對汽車的基礎(chǔ)構(gòu)造和一些核心零部件產(chǎn)生自己的理解,甚至?xí)鲃友芯科涞讓永碚摗?/p>
但你上來就去想去研究發(fā)動機(jī)制造原理,動力傳感等等,雖然這并不一定有錯(cuò),可能你自己本身對這個(gè)就比較感興趣,但除了極少部分人之外,這種方式明顯不利于學(xué)習(xí)汽車,畢竟研究理論哪有開車有意思。
所以,對一些沒有技術(shù)基礎(chǔ),甚至根本不懂技術(shù)的人來說,學(xué)習(xí)大模型也沒你們想象的那么困難和復(fù)雜,只不過你選擇的方式有問題。
做任何事情,最重要的是有一套學(xué)習(xí)和做事的方式方法;比如說先從簡單的開始,而不是從復(fù)雜的開始;簡單意味著成就感,復(fù)雜意味著挫敗感。
大模型的基礎(chǔ)理論對剛開始學(xué)習(xí)大模型的人來說,已經(jīng)屬于很復(fù)雜的一部分了,而且理論這玩意看多了就容易想的多,想多了就容易鉆牛角尖,一旦鉆牛角尖就會陷進(jìn)去出不來。
就拿小編自己來說,以前學(xué)東西就喜歡鉆牛角尖,上學(xué)的時(shí)候?qū)W物理化學(xué),喜歡研究為什么,為什么會這樣,為什么不能那樣,然后越走越偏。事實(shí)上對學(xué)生來說,受限于當(dāng)時(shí)的知識水平,很多東西只需要記住就可以了;因?yàn)闆]辦法給你解釋為什么,而且也沒必要。
上大學(xué)的時(shí)候?qū)W習(xí)編程,一直到工作之后還喜歡問為什么;比如學(xué)習(xí)java和python,一直想把這種編程語言的所有原理,所有知識都弄明白,然后就浪費(fèi)了大量的時(shí)間和精力,最重要的一點(diǎn)就是當(dāng)時(shí)有些問題想明白了,但沒有經(jīng)過實(shí)際操作,沒過多久又都忘完了。
學(xué)習(xí)中間件MQ的時(shí)候,非要去研究MQ怎么發(fā)消息,怎么收消息;這個(gè)還屬于正常,但在不知道具體應(yīng)用場景的前提下,非要想著把它的多種消息類型都給弄明白。
但事實(shí)上,最高效的方式就是,了解MQ的基本作用和功能,然后在工作中根據(jù)不同的場景去學(xué)習(xí)和體驗(yàn)不同消息類型的作用,而這才能真正提升你的中間件的理解。
為什么找工作的時(shí)候,面試官喜歡問工作經(jīng)驗(yàn)?
原因就在于此;而且不知道大家有沒有發(fā)現(xiàn),別人讓我們回答一個(gè)問題的時(shí)候,最簡單的方式就是給別人舉個(gè)例子;而這個(gè)例子就是你的工作經(jīng)驗(yàn),有些人沒有工作經(jīng)驗(yàn),回答這種問題的時(shí)候,你能明顯感覺到他漏洞百出。
所以別人讓你講什么是大模型?
雖然你也可以通過背大模型的定義或者看別人怎么介紹大模型;但如果你真的有大模型的使用經(jīng)驗(yàn),那么你可以通過自己的經(jīng)驗(yàn),用更加通俗的話或例子來讓別人明白什么是大模型。
而不是別人口中所說的,大模型全稱是具有大規(guī)模參數(shù)和復(fù)雜計(jì)算結(jié)構(gòu)機(jī)器學(xué)習(xí)模型,后面巴拉巴拉。。。。。
雖然這個(gè)說法很專業(yè),但事實(shí)上對不懂大模型的人來說無異于天書。
而如果換成,大模型就是一個(gè)能夠像人類一樣,能夠進(jìn)行寫作,繪畫和剪輯視頻的系統(tǒng);并且還有一些簡單的邏輯判斷能力。
雖然這樣說不是很準(zhǔn)確,并且也不是完全正確,但確實(shí)更容易讓別人知道,大模型能寫作和畫畫,雖然大模型還可以做更多的事。
本文轉(zhuǎn)載自公眾號AI探索時(shí)代
原文鏈接:??https://mp.weixin.qq.com/s/Z6ooEBNdIeOqTjSdlX_ktw??
