機器學習背后的數學支柱,這5本書幫你搞定
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)
機器學習從只適用于研發人員的工具變成了被廣泛采納使用的方法,多虧了開源機器學習和深度學習框架的爆炸性發展?,F如今,機器學習領域比以往任何時候都更容易上手。同時,這也助力了我們目前所經歷的科技的瘋狂發展。
弄清算法是如何真正工作的,可以幫助你在設計、開發和調試機器學習系統方面獲得巨大優勢。很多人提到數學就打哆嗦,機器學習恰巧涉及很多數學知識,這項任務可能會令很多人怯步。
然而,數學并不該成為人們在機器學習領域的“絆腳石”。相反,學好數學對于掌握機器學習非常有必要。從高層次上講,機器學習中涉及四大數學支柱:線性代數、概率論、多元微積分、最優化理論。
為這些核心理論構建牢固基礎,了解最先進的機器學習算法(例如卷積網絡、生成式對抗網絡等)的內部工作原理,我們需要為此付出時間,這并不是用一個下午能搞定的事情。
但鑒于你不斷為此付出時間,也能夠在短時間內便學到不少知識。在本文中,我選擇了五本對我最有幫助的書籍,希望對你也會有幫助。
1. 《線性代數應該這樣學》——謝爾頓·阿克斯勒
如果以“傳統”方式講授線性代數(先學習行列式和矩陣,再學習向量空間),對初學者而言太難了,線性代數將成為一門美麗卻艱難的學科。
當我們把教學順序調換一下,這門課程會變得十分直觀和清晰。本書以非常友好和有見地的方式介紹了線性代數。多希望我最初是通過這本書學習的線性代數而不是老方法。
2. 《與深度學習神交》——安德魯·特拉斯克
這本書是這個清單中我最喜歡的一本。如果你只有閱讀一本書的時間,一定不要錯過這本。
本書包含了對神經網絡內部工作原理的完整實操介紹,選取了代碼片段作為所有素材。盡管這本書并非專門針對高等數學,但讀過這本書后,你對深度學習數學知識的了解將多于95%的數據科學家、機器學習工程師和其他開發人員。
你還可以從頭開始構建神經網絡,這或許是最佳的練習方法。當用機器學習開始構建神經網絡時,我也曾使用NumPy從零開始構建了卷積網絡。
3. 《概率論:給滿腔熱忱的初學者》——大衛·莫林
大多數有關機器學習的書籍都沒有正確地介紹概率論,而是充滿了令人困惑的符號,且經?;煜芏群瘮岛碗x散分布。讀者如果沒有扎實的概率論背景知識是很難理解的。
而本書將為你帶來對概率論詳細、正確且簡單清晰的介紹。這適用于之前對概率論沒有任何了解的學習者。
4. 《多變量微積分》——丹尼斯·奧魯 (來自麻省理工學院開放式課程)
這并不是一本書,而是麻省理工學院一門有關多變量微積分并可對公眾開放的大學錄制課。在我所知道的所有資源中,這門課程是迄今為止對該主題的最佳介紹。
對于有單變量微積分背景知識的聽課者來說,這門課程能夠錦上添花,即便沒有,聽課者也能夠輕松跟上。它唯一的缺點是沒能很好地介紹到的知識點是梯度下降算法,而這是神經網絡的基礎。
5. 《深度學習》——伊恩·古德費洛、約舒亞·本吉奧與亞倫·庫維爾
這本書由機器學習領域中一些最有才華的人撰寫而成,包含了上述的所有理論,是深度學習研究人員和開發人員的首選資源。該書綜合了數學理論并使用了重型機器,為諸如卷積和遞歸網絡、自動編碼器等最新深度學習方法提供了可靠指導。
最棒的一點是大家可以在線上免費閱讀這本書(https://www.deeplearningbook.org/)。
在我羅列出的所有書目中,這本書可能是最難以理解的。理解深度學習需要從概率論的角度看待算法實在有些困難。
圖源:unsplash
攻克這些書目肯定算不上輕松,或許會花費不少時間,但相信我,你一定會有所收獲。積累知識是最好的投資。這些知識將為你構建機器學習系統帶來巨大優勢,更不用說機器學習背后的理論本身就是十分美好而迷人的。