為什么你會覺得大模型很難學(xué)？甚至學(xué)了好久還不知道大模型到底是個(gè)什么玩意？原創(chuàng)

AI探索時(shí)代

發(fā)布于 2024-10-17 13:14

瀏覽

0收藏

“ 先從簡單的開始，而不是從復(fù)雜的開始；簡單意味著成就感，復(fù)雜意味著挫敗感 ”

理論是來自于現(xiàn)實(shí)中的實(shí)踐結(jié)果，理論來自于實(shí)踐，驗(yàn)證于實(shí)踐；單純的理論是沒有生存空間的。

為什么你覺得大模型很難？甚至覺得學(xué)不會大模型？

原因就在于你太沉迷于理論，而忽略了實(shí)踐的意義。

大模型不是一個(gè)純理論的科學(xué)

大模型技術(shù)并不是一個(gè)純粹的理論科學(xué)，而是一個(gè)具有較強(qiáng)實(shí)踐性的實(shí)踐科學(xué)。

我們有很多人在學(xué)習(xí)大模型技術(shù)的過程中，覺得大模型好難，好抽象，看了好多書和視頻，最后還是記不清楚大模型是什么。原因何在？

原因就是他們沉迷于理論無法自拔，理論是對實(shí)踐結(jié)果的抽象和總結(jié)；只重視理論的結(jié)果只有一個(gè)，那就是眼高手低，說什么都懂，做什么都錯(cuò)。

當(dāng)然說這些話并不是說理論不重要，而是說理論要于實(shí)踐相結(jié)合才能發(fā)揮更大的威力；理論和實(shí)踐就是硬幣的一體兩面，誰離了誰都沒有生存的空間以及存在的意義。

為什么你會覺得大模型很難學(xué)？甚至學(xué)了好久還不知道大模型到底是個(gè)什么玩意？-AI.x社區(qū)

比如說很多人學(xué)習(xí)大模型的時(shí)候，看到網(wǎng)上的一些文章或視頻，就覺得學(xué)習(xí)大模型要學(xué)習(xí)機(jī)器學(xué)習(xí)理論，Transformer架構(gòu)，各種算法，向量處理等。

然后就硬著頭皮買幾本書或找?guī)讉€(gè)視頻開始深入研究，然后沒過幾天就放棄了，原因是覺得這玩意太難了，看又看不懂，學(xué)又學(xué)不會。

作為一個(gè)正常人，我想絕大部分人看著大模型技術(shù)中的理論架構(gòu)和數(shù)學(xué)算法都會頭疼，原因就是你跑偏了，沒有弄清楚事情的本質(zhì)。

你學(xué)習(xí)的是大模型技術(shù)，而不是來學(xué)習(xí)數(shù)學(xué)的，而且數(shù)學(xué)算法只是實(shí)現(xiàn)大模型技術(shù)的一種方式即使不懂?dāng)?shù)學(xué)，也不耽誤你學(xué)習(xí)大模型；原因就是，有幾個(gè)司機(jī)知道汽車是怎么造出來的嗎？因?yàn)樗麄兏静恍枰溃恍枰獣_就行。

同樣，數(shù)學(xué)和一些大模型理論對學(xué)習(xí)大模型來說，就像你去駕校學(xué)習(xí)開車；正常情況下是教練教你怎么踩油門，怎么打方向盤，怎么停車，怎么起步等等；然后在此基礎(chǔ)之上，你自己開幾年車之后，期間會遇到各種各樣的問題，這時(shí)你自己就會對汽車的基礎(chǔ)構(gòu)造和一些核心零部件產(chǎn)生自己的理解，甚至?xí)鲃友芯科涞讓永碚摗?/p>

但你上來就去想去研究發(fā)動機(jī)制造原理，動力傳感等等，雖然這并不一定有錯(cuò)，可能你自己本身對這個(gè)就比較感興趣，但除了極少部分人之外，這種方式明顯不利于學(xué)習(xí)汽車，畢竟研究理論哪有開車有意思。

為什么你會覺得大模型很難學(xué)？甚至學(xué)了好久還不知道大模型到底是個(gè)什么玩意？-AI.x社區(qū)

所以，對一些沒有技術(shù)基礎(chǔ)，甚至根本不懂技術(shù)的人來說，學(xué)習(xí)大模型也沒你們想象的那么困難和復(fù)雜，只不過你選擇的方式有問題。

做任何事情，最重要的是有一套學(xué)習(xí)和做事的方式方法；比如說先從簡單的開始，而不是從復(fù)雜的開始；簡單意味著成就感，復(fù)雜意味著挫敗感。

大模型的基礎(chǔ)理論對剛開始學(xué)習(xí)大模型的人來說，已經(jīng)屬于很復(fù)雜的一部分了，而且理論這玩意看多了就容易想的多，想多了就容易鉆牛角尖，一旦鉆牛角尖就會陷進(jìn)去出不來。

就拿小編自己來說，以前學(xué)東西就喜歡鉆牛角尖，上學(xué)的時(shí)候?qū)W物理化學(xué)，喜歡研究為什么，為什么會這樣，為什么不能那樣，然后越走越偏。事實(shí)上對學(xué)生來說，受限于當(dāng)時(shí)的知識水平，很多東西只需要記住就可以了；因?yàn)闆]辦法給你解釋為什么，而且也沒必要。

上大學(xué)的時(shí)候?qū)W習(xí)編程，一直到工作之后還喜歡問為什么；比如學(xué)習(xí)java和python，一直想把這種編程語言的所有原理，所有知識都弄明白，然后就浪費(fèi)了大量的時(shí)間和精力，最重要的一點(diǎn)就是當(dāng)時(shí)有些問題想明白了，但沒有經(jīng)過實(shí)際操作，沒過多久又都忘完了。

學(xué)習(xí)中間件MQ的時(shí)候，非要去研究MQ怎么發(fā)消息，怎么收消息；這個(gè)還屬于正常，但在不知道具體應(yīng)用場景的前提下，非要想著把它的多種消息類型都給弄明白。

但事實(shí)上，最高效的方式就是，了解MQ的基本作用和功能，然后在工作中根據(jù)不同的場景去學(xué)習(xí)和體驗(yàn)不同消息類型的作用，而這才能真正提升你的中間件的理解。

為什么找工作的時(shí)候，面試官喜歡問工作經(jīng)驗(yàn)？

原因就在于此；而且不知道大家有沒有發(fā)現(xiàn)，別人讓我們回答一個(gè)問題的時(shí)候，最簡單的方式就是給別人舉個(gè)例子；而這個(gè)例子就是你的工作經(jīng)驗(yàn)，有些人沒有工作經(jīng)驗(yàn)，回答這種問題的時(shí)候，你能明顯感覺到他漏洞百出。

為什么你會覺得大模型很難學(xué)？甚至學(xué)了好久還不知道大模型到底是個(gè)什么玩意？-AI.x社區(qū)