2021年,每個(gè)數(shù)據(jù)科學(xué)家都應(yīng)該閱讀的5本書
今天要和大家推薦5本每個(gè)數(shù)據(jù)科學(xué)家都應(yīng)該閱讀的書籍:
1. 《The Data Science Handbook》
這本書絕對(duì)應(yīng)該放在每個(gè)數(shù)據(jù)科學(xué)家的書架上,它包含了對(duì)25位來自不同公司、行業(yè)和經(jīng)驗(yàn)水平的數(shù)據(jù)科學(xué)家的采訪。他們會(huì)給你一些寶貴的意見,告訴你如何長遠(yuǎn)規(guī)劃自己的職業(yè)生涯,為哪家公司工作,如何保持學(xué)習(xí),以及他們?nèi)绾慰创磥韼啄赀@個(gè)領(lǐng)域的變化。這本書里還有很多很有價(jià)值的見解,尤其如果你是一個(gè)初學(xué)者。
建議你從書中找到一些些有趣的問題,然后在你真正想為之工作的公司工作的數(shù)據(jù)科學(xué)家提問,這樣你也可以得到不一樣的見解,但還是要根據(jù)你的實(shí)際情況而定。
2. 《面向數(shù)據(jù)科學(xué)家的實(shí)用統(tǒng)計(jì)學(xué)》
如果你有一定的技術(shù)背景,需要了解更多關(guān)于統(tǒng)計(jì)數(shù)據(jù),或者你有一定的學(xué)術(shù)背景,掌握一定的統(tǒng)計(jì)相關(guān)的理論知識(shí),但在實(shí)踐中并不常用,這本書將帶你過一遍統(tǒng)計(jì)的主要概念,如分布和機(jī)器學(xué)習(xí),并向你展示如何使用Python,這是一本很好的中級(jí)水平的書,重點(diǎn)是應(yīng)用,而不是理論。
我強(qiáng)烈建議你仔細(xì)閱讀這本書中的代碼,嘗試復(fù)制其中的一些代碼片段,并對(duì)它們進(jìn)行調(diào)整,看看它們是如何運(yùn)行的。
3. 《精通特征工程》
特征工程可以說是數(shù)據(jù)科學(xué)工作流程中最重要的步驟之一。一旦你對(duì)工作流程和主要算法有了良好的總體認(rèn)識(shí),你就應(yīng)該開始提高你的功能工程技能。這基本上意味著要掌握許多不同的工具以及何時(shí)使用它們,這取決于你的數(shù)據(jù)和目標(biāo)。
這本書很好地結(jié)合了理論、應(yīng)用,我建議你一邊閱讀一邊做筆記,然后它放在身邊作為參考指南。
4. 《機(jī)器學(xué)習(xí)精講》
這是了解數(shù)學(xué)背后的主要ML算法最好的書籍之一,全書概念解釋清楚,介紹精簡,它應(yīng)該是你開始機(jī)器學(xué)習(xí)之旅時(shí)首先要讀的書之一,尤其是當(dāng)你已經(jīng)有一定數(shù)學(xué)基礎(chǔ)的時(shí)候。如果你真的想詳細(xì)研究這本書,我建議你嘗試用自己熟悉的編程語言來實(shí)現(xiàn)其中的算法,從而幫助自己鞏固知識(shí)。
5. 《貝葉斯思維》
一旦你開始學(xué)習(xí)統(tǒng)計(jì)學(xué),你就會(huì)經(jīng)常讀到貝葉斯和某些貝葉斯算法,如果你不知道這兩種方法的區(qū)別,一旦你理解了這種區(qū)別,學(xué)習(xí)貝葉斯統(tǒng)計(jì)就會(huì)非常有用,以便掌握貝葉斯算法并將其添加到你的工具庫當(dāng)中去,我特別推薦這本書,如果你有統(tǒng)計(jì)學(xué)背景,但之前從未詳細(xì)學(xué)習(xí)過貝葉斯方法,它沒有深入這個(gè)主題,但它已經(jīng)足夠讓你在Python中使用貝葉斯統(tǒng)計(jì)。