數分工具鄙視鏈:Python成老大,Excel小弟都稱不上?
佛說,一切眾生相皆是無相。數據分析做到極致,也可以“無相無生”。
在說今天的話題之前,我想先拋出一個結論:
- “做數據分析,不要建立一種以掌握的軟件來給自己分級的心態,但是一定要用工具避免誤入職業發展的歧途!”
為什么今天要談關于數據分析工具分級的問題呢?
其實這涉及到職場中一個非常常見的現象——工具鄙視鏈:
- 會python編程語言的,瞧不起用自助BI工具做數據分析的;
- 會用Tableau、FineBI這種分析工具的,瞧不起會用SPSS、SQL這種數據工具的;
- 會用SPSS、SQL的,瞧不起用PPT做數據匯報的;
- 會用PPT做數據匯報的,瞧不起只會用Excel做數據統計與整理的;
逃不開的鄙視鏈
不光是數據分析行業,在程序員、產品經理等行業中都存在這樣的鄙視鏈
也有不少人和公司,遵從著這樣的鄙視鏈現象,通過這樣的鄙視鏈進行崗位的分級,或者作為選人招聘的門檻標準
而這個鄙視鏈似乎是與這個崗位生死同戚、共生共存、難以分離的:
- 比如我,在前幾年我還剛接觸數據分析的時候,只學會用Excel做數據處理,所有的數據清洗、數據加工和圖表可視化工作都是用Excel完成的
但是看著網上很多人都在學Python編程,當時還有一種“python才是數據分析標配”的言論,我也成為了跟風的一份子

當時帶我的老大就告訴我:
- “網上說學python才能做數據分析的,純粹就是放屁,python做數據分析確實比Excel要專業一些,但是真正的核心,是要是什么數據場景和什么人在用。
我用Excel做的數據清洗絕對能完爆這些工具,但是我想做一些高級可視化,也會用python去做,誰規定數據分析師只能用一個軟件了?
說到底還是出于對數據分析崗位的自卑,數據分析才出現幾年啊,誰都覺得用Excel做數據分析太low逼了,一點體現不出我們的專業性,不學一門編程語言,其他部門的人誰瞧得起我們?”
對于我老大的話,我深以為然,正是出于對于數據分析作崗位的錯誤認知,才會造成那么多人對于數據分析工具的誤解
其實這么多年,excel、Tableau、FineBI、PowerBI、SPSS、Python......我幾乎每種工具和軟件都用過,并沒有覺得哪一種是最萬能的
工具從來只是工具,是用來輔助我們進行數據分析的,最核心的關鍵還是在于人,也就是你是否真的具有數據分析思維和能力
像我之前老大的能力,用Excel照樣牛逼;要是沒有能力,學一萬種語言都沒用!
所以很多剛入門數據分析的朋友,一上來就買很多Python,R語言,VBA的書籍和資料,安裝了各個語言的環境
但其實數據分析師的日常工作,最多就是用到SQL取數以及Excel數據透視圖、BI分析工具中拖拉拽圖表

所以,會用工具不是能力,懂得數據思維,才是數據分析師存在的意義
工具是輔助
那么回到我們今天的話題,數據分析當中有著不同的數據場景,會用到非常多的工具,那么應該如何選擇,下面簡單舉幾個例子
1、excel
別以為EXCEL只會處理表格,你可以把它當成數據庫,也可以把它當成IDE,甚至可以把它當成數據可視化工具來使用
它可以創建專業的數據透視表和基本的統計圖表,但由于默認設置了顏色、線條和風格,使其難以創建用于看上去“高大上”視覺效果
盡管如此,我仍然推薦你使用Excel
2、BI工具
近幾年冒出來的BI之秀,如TB、qlk都強調可視化,一改傳統BI工具SAP BO、IBM家的cognos(不過近幾年貌似都在研發云BI)
這里不談開源,還沒見到能成熟應用的BI,成熟的BI工具如FineBI(國內)和 Tableau(國外),都很推薦

3、python
學過Python數據分析的朋友都知道,在可視化的工具中,有很多優秀的三方庫,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,這些可視化庫都有自己的特點,在實際應用中也廣為大家使用

4、SPSS
SPSS是統計分析入門軟件,如果你想快速入門而又不想學習編程,我推薦使用SPSS
學習SPSS的重點并不在于軟件本身,而是相關的統計學知識,這也是在前面建議大家鋪墊的,也就是你要學會怎樣去分析“輸入數據后,軟件給你呈現的結果”
推薦大家一本書:《如虎添翼 數據處理的SPSS/SAS EG實現》,徐筱剛老師寫的,十分適合SPSS新手入門
最后說點啥
其實今天談的這個話題,也是其他行業里常見的現象之一,既然產生了這種亂象,說明一定有其產生的原因與邏輯,我們不必太過敏感
但是,對于我們數據分析師自身而言,真正做分析時候,你會發現市面上有太多的分析工具,需要掌握的實在是太多了
其實不必糾結于此,依據個人能力,配合當前的數據分析環境,適用的工具自然會被選出,最后記住一句話:工具是人用的,重點在于人,而不在于工具!