不能成為數據科學家?沒關系,你還可以擁有數據思維
原文作者: Christian Bonilla
選文&翻譯: 吳佳樂 薛菲
校對:Aileen
數據科學家日益突顯的影響力令人驚嘆——每次讀到這種論調的文章我都感到好笑。雖然不是所有文章都像《哈佛商業評論》一樣宣稱數據科學家將是“21世紀最熱門的職業”,但是,幾乎都是千篇一律的“我們預見了未來”的語氣。我認為這種觀點并沒有錯,但是在這種趨勢中,我沒有發現什么是值得驚奇或者是新鮮的。如果《洋蔥報》(The Onion, 美國***的幽默諷刺雜志)要報道,我想標題應該是:
“***研究表明,精通數學和編程的人被大量地雇傭”。
這有什么新鮮的呢?自從上世紀70年代以來,擅長數學和編程的人們就在華爾街發家致富了。隨著越來越多的公司產生海量的數據,對于數學和編程技能的需求已經延伸到了新興的行業,更不必說技術部門了。但是,數學和編程只是價值正在迅速上升的量化分析能力中的一部分。去年8月紐約時報的一篇文章是一個極好的例子,能夠說明新聞媒體對此的熱切關注度:一位在舊金山工作的服務生Paul Minton,在決心成為一名數據科學家后,經過3個月的編程和數據分析課程,年薪就從2萬變成了六位數。看吶,一個數據科學的奇跡!
補充一點細節(這篇文章指出了此點非常值得贊揚,雖然只是略帶而過):Minton擁有數學專業的本科學位。換句話說,他是一位非常聰明的服務生。我不了解Minton,也不想妄加評論他本人或者紐約時報或者服務生。但是,大多數人是沒有天資在如此短的時間內實現同樣的轉變的。我在以前的博客和書中曾經說過,我是編程學校和非傳統學習平臺的忠實擁護者。但是不能只注意到Minton“僅僅3個月”就完成了他的非凡轉變,卻忽略了他之前數年的教育中包含了微積分,統計學,概率論和其他這些除了編程技術以外的高深課程,這些都是取得數學本科學位所必須的。我猜Minton至少對MATLAB有一點印象。對于大多數人而言,他們不僅沒有數年的相關訓練,而且即使接受免費培訓他們也不一定能夠掌握編程能力。我就是其中之一。
相比于我大學時期,現在的就業市場需要數學和統計學能力已經不再是秘密,但是這并不意味著它們更容易學習。在我大學的朋友中,我的量化分析能力至多是略高于平均水平。雖然我的微積分和統計學學得非常好,但是良好的數學基礎使我能夠應付我的經濟學專業的同時,也讓我發現擅長數學不再是我的長期優勢。我清楚地認識到,我的職業生涯無法僅僅建立在我比其他人數學更好的基礎上。對于數學,我想大多數人有這樣的意識后都會比周圍人更加困擾。
我之所以提出這些是希望當你為自己的數學學位感到害羞,聽到數據科學家的需求量巨大就如聽到國家橄欖球聯盟的四分衛收入很高一樣時,能夠清醒地說,“是的,當然如此。”
好消息是,即使不能成為一位數據科學家,通過培養自己的數據思維,你仍然能夠提升自身價值,使工作更出色。
當今職場秘密武器:用數據說話
這些年有一件讓事情讓我震驚:大多數人對自己公司的數據的了解少之又少。我接觸過的大多數公司里根本沒有幾個人有能力用最基本的方法分析他們的數據,更別提有足夠的數據科學家人手了。最近有個大型酒店集團的營銷經理向我吐槽:公司里“也就2-3個人”可以分析原始的銷售數據,只有他們對業務和內部信息系統都有足夠的了解。我接觸的另一個商用品分銷公司有幾萬名員工,但是只有5、6個人可以快速地回答公司高層提出的問題,其他的人要么不夠了解數據庫要么不夠了解公司業務。還有一個大型零售連鎖集團里只有很小一撮人可以很快地分析他們的原始數據。很多公司甚至專門設立了”客戶洞察”部門。他們的使命是專門幫助其他部門解決跟那些該死的數據有關的問題。
是什么造成了這種現象呢?
這些公司的信息系統應該負一部分責任。現在有很多企業因為時間的積累或者是多次并購,繼承了很多個不同類型的信息系統。這些系統對于沒有技術背景的人來說非常難以使用。僅僅這一條就可以讓大多數的人對于公司的原始數據望而卻步。但是更大的障礙其實是人的惰性。就算公司有還不錯的分析數據的工具(比如一個關系型數據庫),也只有少數的人有耐心和好學心去了解。其他大多數人只是想等待數據出現在一個Excel表格里或者一個展示板上供他們使用。這不簡單是需要學習一門新的查詢語言(SQL)的問題。要想要明白公司的數據模型是怎樣的,數據是怎么樣存儲的這些都需要反復實驗,這會消耗很多耐心和精力。現實世界中的數據和在商學院中用的數據是完全不一樣的,手里的數據永遠沒有書里的那么整潔可靠。這就是為什么絕大部分人都直接使用他們的IT部門整合好的數據。這些數據比較靠譜,不需要考慮太多跟數據本身無關的事情。
但是僅僅使用這些別人寫好的數據報告和展示板有一個問題,就是你很難在職場中脫穎而出。因為大家的信息都是對稱的,這些數據的一絲一毫所有人都看的清清楚楚。雖然數據的質量很重要,但這會大大限制你創新的能力。當你手中別人給你做好的數據并不能幫助你解答你想知道的問題時怎么辦?舉個例子,假設你想測試一下那些全家自駕游的客人在酒店的消費特征。這時你需要自己篩選分析那些只來過酒店一次,點了兒童菜單的東西到房間里而且還加了一張折疊床的客戶。這種分析可以讓你的老板認真聽取你報告的內容。這種問題如果可以自己解決比要要別人幫助好十倍。
解決這些問題并不難,不需要高中畢業就可以搞定。你只需要合適的數據加上一顆好學心。
提出簡單的問題可以事半功倍
有人說聰明的人喜歡問復雜的問題,但是絕頂聰明的人往往會問簡單的問題。的確,最重要的業務問題往往也是最簡單的問題。比如:為什么客戶沒有選擇競爭對手的產品而是選擇了我們的產品?為什么曾經選擇了我們產品的人卻最終放棄了這個產品?我們應該為了增加銷售量而降價嗎?當你是職場新人的時候你往往在埋頭做一些細節的工作,沒人會問你這種問題。但隨著你經驗增多,真正可以搞定這些問題的時候你可以開始為解決公司最根本最重要的問題做貢獻,升職加薪走向人生***!
回顧我的職業生涯,我學到最有用的業務技能就是SQL,用這個語言我可以直接查詢一個公司的原始運營數據,直接了解關于這個公司業務的基本特點。我漸漸發現自己很擅長提出不錯的問題,需要的只是一些能幫我解決這些問題的工具。更重要的是,當一個人用過內部的數據庫查詢過公司的信息后你就會發現,使用數據庫的經驗可以教你提出更好的問題。說白了就是,用過數據庫之后就知道怎樣可以提出一個在數據庫中可以精確回答的問題。這讓人沒有以前那么懶惰,因為計算機和人不一樣,它并不懂得怎樣揣摩你真正的意圖。這樣在不知不覺中就學會了如何更加系統地思考。
原文鏈接:http://www.smartlikehow.com/blog-native/2015/12/1/not-a-data-scientist-no-problem-you-can-still-be-data-savvy-than-most
【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】