同樣是用Excel,為什么別人那么優(yōu)秀?
“為什么同樣是用Excel工作,新來的小李竟能比我這資深表哥快這么多”。
對自己多年練就的“神速做表手”充滿信心的老王怎么也想不明白,為什么自己最快也要兩天才能做好的數(shù)據(jù)報表,到新來的小李手里只用半天就搞定了。
其實要解釋老王的疑惑一點也不難,小李站在“表結(jié)構(gòu)”數(shù)據(jù)上跳舞,而老王仍停留在傳統(tǒng)Excel的“表格結(jié)構(gòu)”數(shù)據(jù)上埋頭苦干。
兩者雖然只有一字之差,但“表結(jié)構(gòu)”數(shù)據(jù)比“表格結(jié)構(gòu)”數(shù)據(jù)更具優(yōu)勢,而且這種優(yōu)勢是單憑人的快速熟練的操作技巧所追趕不上的。
1、什么是表結(jié)構(gòu)數(shù)據(jù),什么又是表格結(jié)構(gòu)數(shù)據(jù),兩者間又有什么區(qū)別呢?
- 表格結(jié)構(gòu)數(shù)據(jù)就是我們傳統(tǒng)使用的Excel工作表數(shù)據(jù),
- 表結(jié)構(gòu)數(shù)據(jù)則是像數(shù)據(jù)庫中數(shù)據(jù)表一樣的數(shù)據(jù)結(jié)構(gòu)。
兩者間***的區(qū)別就是基本計算單位不同。
表格結(jié)構(gòu)數(shù)據(jù)基本計算單位是單元格,如果在C1單元格中輸入公式“=A1+B1”,則公式將分別引用單元格A1與單元格B1中的值,再將兩個值相加并在C1單元格中返回計算結(jié)果。整個運算過程都是基于單元格完成的,像這樣以單元格為參照對象進(jìn)行計算的數(shù)據(jù)結(jié)構(gòu)就是表格結(jié)構(gòu)數(shù)據(jù)。
表結(jié)構(gòu)數(shù)據(jù)的基本計算單位是整列數(shù)據(jù),如下圖所示,先在Excel的A列和B列中分別輸入商品數(shù)量和商品單價的相關(guān)信息,然后使用開始選項卡中套用表格格式功能將A列和B列中的值轉(zhuǎn)換為表結(jié)構(gòu)數(shù)據(jù),并且在C2單元格中輸入公式“=[@商品數(shù)量]*[@商品單價]”并點擊回車后……
會神奇的發(fā)現(xiàn),再不用向下拖拽公式了,所有不同行上的商品數(shù)量與商品單價的乘積的結(jié)果都會自動顯示在C列中。
這是因為表結(jié)構(gòu)數(shù)據(jù)的基本計算單位是整列數(shù)據(jù),表結(jié)構(gòu)數(shù)據(jù)對列中所有行上的值進(jìn)行統(tǒng)一計算,并統(tǒng)一返回所有行上值對應(yīng)的計算結(jié)果的原因。
2、表結(jié)構(gòu)數(shù)據(jù)的優(yōu)勢在哪?
表結(jié)構(gòu)數(shù)據(jù)在以下幾個方面具有表格結(jié)構(gòu)數(shù)據(jù)無法比擬的優(yōu)勢:
- 優(yōu)勢1:可對零散數(shù)值進(jìn)行不同維度下的匯總觀測
- 優(yōu)勢2:可非常輕松地關(guān)聯(lián)并整合多種不同數(shù)據(jù)源數(shù)據(jù)
- 優(yōu)勢3:可對大規(guī)模數(shù)據(jù)進(jìn)行批量計算,其速度遠(yuǎn)大于表格結(jié)構(gòu)數(shù)據(jù)
- 優(yōu)勢4:可在不同表間建立關(guān)聯(lián)關(guān)系,讓所有不同維度數(shù)據(jù)表整合為一個完整的多維數(shù)據(jù)模型
- 優(yōu)勢5: 多數(shù)表結(jié)構(gòu)數(shù)據(jù)處理工具記錄的是運算過程而非計算結(jié)果,所以一旦記錄好一次完整、準(zhǔn)確的運算過程,便可反復(fù)利用,可大幅減少在Excel傳統(tǒng)工作表中進(jìn)行的重復(fù)性工作。
3、表結(jié)構(gòu)數(shù)據(jù)是如何完勝的?
正是以上五點優(yōu)勢幫助站在表結(jié)構(gòu)數(shù)據(jù)上跳舞的小李完勝了還在表格結(jié)構(gòu)數(shù)據(jù)上苦干的老王,那么為什么小李會完勝老王呢?
老王要制作的數(shù)據(jù)報表需要先從多個不同的數(shù)據(jù)源中采集數(shù)據(jù),這些數(shù)據(jù)有來自于CSV格式文本文件的,Excel的,數(shù)據(jù)庫中多個不同數(shù)據(jù)表的,TXT格式文本文件等等
每次老王需要一個個將這些數(shù)據(jù)源中的數(shù)據(jù)復(fù)制粘貼到自己工作用的Excel文件中的多個不同工作表中,要處理的數(shù)據(jù)行數(shù)多達(dá)六萬行。
V好數(shù)據(jù)后,當(dāng)前文件很有可能因為計算資源枯竭而導(dǎo)致崩潰,老王需要盡快把這份數(shù)據(jù)轉(zhuǎn)移到一個新的Excel文件上。
轉(zhuǎn)移過后,老王需要繼續(xù)添加多個計算列才能完成一份完整的數(shù)據(jù)源,有了數(shù)據(jù)源后,老王還需要制作多個數(shù)據(jù)透視表來獲得最終數(shù)據(jù)報表中使用的匯總值,有了匯總值,老王才可以著手準(zhǔn)備數(shù)據(jù)報告。
老王負(fù)責(zé)的數(shù)據(jù)報表是周報,也就是說每周都要重復(fù)一次上述所有的工作流程,在制作報表過程中哪怕有一步做錯了都要再重新來過……
我不想再說下去了,表哥表姐表叔表嫂們心里的苦是說不清道不盡的。
那么面對同樣的工作問題,已經(jīng)玩轉(zhuǎn)表結(jié)構(gòu)數(shù)據(jù)的小李又是如何做的呢?
小李用到了Excel中專門處理表結(jié)構(gòu)數(shù)據(jù)的Power Query以及Power Pivot工具。
他先用Power Query直接關(guān)聯(lián)到多個不同數(shù)據(jù)源上,將這些數(shù)據(jù)源中的數(shù)據(jù)統(tǒng)一導(dǎo)入到Power Query數(shù)據(jù)環(huán)境下,然后使用合并功能,輕松將所有不同數(shù)據(jù)源中數(shù)據(jù)匯總到了一起,這就是表結(jié)構(gòu)數(shù)據(jù)***個優(yōu)勢。
然后小李在整合好的數(shù)據(jù)中添加計算字段,雖然數(shù)據(jù)量很大,但因為表結(jié)構(gòu)數(shù)據(jù)具有“可對大規(guī)模數(shù)據(jù)進(jìn)行批量計算,其速度遠(yuǎn)大于表格結(jié)構(gòu)數(shù)據(jù)”的優(yōu)勢,瞬間就完成了所有計算任務(wù)。
然后小李把加工好的多個數(shù)據(jù)表一起導(dǎo)入到Power Pivot中創(chuàng)建關(guān)聯(lián)關(guān)系,搭建了統(tǒng)一的多維數(shù)據(jù)環(huán)境,并且在Power Pivot中設(shè)計了復(fù)雜的匯總計算規(guī)則,在完整的數(shù)據(jù)環(huán)境上,小李非常輕松的獲得了報表所需的數(shù)據(jù)匯總值。
并且在此基礎(chǔ)上還為領(lǐng)導(dǎo)提供了可做篩選操作的多個不同的觀測維度信息。這就是表結(jié)構(gòu)數(shù)據(jù)的第三和第四個優(yōu)勢。
小李創(chuàng)建的整個處理過程被完整的記錄在Power Query與Power Pivot中,于是,到了每周出周報的時間,小李只需要把數(shù)據(jù)源文件替換好,然后點擊一下Excel中數(shù)據(jù)選項卡下的全部刷新按鈕,稍等片刻,所有工作就全部完成了。再不需要每次都重復(fù)所有的制作過程。
所以一旦記錄好一次完整、準(zhǔn)確的運算過程,便可反復(fù)利用,可大幅減少在Excel傳統(tǒng)工作表中進(jìn)行的重復(fù)性工作”成為小李壓倒老王的***一根稻草。在面對表結(jié)構(gòu)數(shù)據(jù)的高維打擊下,處在低維的表格結(jié)構(gòu)數(shù)據(jù)已經(jīng)開始顯得力不從心。
在業(yè)務(wù)數(shù)據(jù)分析中,常用到的表結(jié)構(gòu)數(shù)據(jù)處理加工分析工具主要有Excel Power BI以及數(shù)據(jù)庫的SQL語句。