不會Python也能分析?從業(yè)以來,我寫過最心痛的一次數(shù)據(jù)分析
本文謹(jǐn)紀(jì)念那些英雄,也為了給大家敲響警鐘,可能我們的一次隨意、一次疏忽、一次不留意,背后就是慘痛的代價。
幾天前,四川涼山這個熟悉的名字,又再次上了熱搜:那些英雄,永遠(yuǎn)離開了我們。
悲痛之余,我開始思考:究竟是什么原因讓這種情況經(jīng)常發(fā)生?
一、數(shù)據(jù)來源
本次數(shù)據(jù)采集于消防網(wǎng)等網(wǎng)站上的公開數(shù)據(jù),網(wǎng)站比較友好地直接提供了數(shù)據(jù)下載方式,所以這次不需要用到python爬蟲,將采集后的數(shù)據(jù)整理如下:

二、數(shù)據(jù)清洗
采集到的數(shù)據(jù)還是有很多的臟數(shù)據(jù),需要先進(jìn)行清洗和處理,才能成為我們進(jìn)行數(shù)據(jù)分析的源數(shù)據(jù)。
原有的數(shù)據(jù)分析模式下,如果我想要分析一個數(shù)據(jù),我需要將所有的數(shù)據(jù)都交給IT處理,需要排期,一般是3-5天,如果中途有數(shù)據(jù)要更換,還要更久。等我拿到數(shù)據(jù)的時候,我也該被開除了。
所以急需一款能夠讓業(yè)務(wù)人員自助分析的工具,還要自帶ETL,這里我推薦FineBI,作為一款企業(yè)級的大數(shù)據(jù)分析工具,個人版卻是永久免費(fèi)的,這是給個人用戶的利好。
說一個它的優(yōu)勢吧,對于5000W以上的大數(shù)據(jù)量,數(shù)據(jù)查詢需要很久,但是如果采用FineBI的OLAP分析預(yù)處理,提前進(jìn)行數(shù)據(jù)建模,3秒就能展示,那分析效率就會大大提高。

這里我先將數(shù)據(jù)導(dǎo)入到FineBI里,創(chuàng)建一個自助數(shù)據(jù)集之后選擇篩選項(xiàng),將空值、異常值等臟數(shù)據(jù)處理掉。

三、數(shù)據(jù)加工
1、計(jì)算四川省山火數(shù)據(jù)占全國總數(shù)的比例
為了能夠很好地對比全國來顯示四川省的山火情況,我將山火次數(shù)、受災(zāi)面積、造成傷亡、較大火災(zāi)數(shù)等進(jìn)行處理 ,新增四列,分別計(jì)算每個指標(biāo)的占比值,數(shù)值格式選定為百分?jǐn)?shù)。

2、計(jì)算四川出動撲火人數(shù)與傷亡數(shù)的對比
這個指標(biāo)主要為了展示四川省山火撲救的難度,普通山火出動的人員較少、傷亡數(shù)較小,如果這個指標(biāo)高于全國平均值,則說明四川山火撲救的難度較大。同樣也是新增一列,添加占比公式,如下。

3、分組匯總森林火災(zāi)的事故原因
因?yàn)榫W(wǎng)站上統(tǒng)計(jì)到山火事故原因較多,主要分為生產(chǎn)性火災(zāi)、非生產(chǎn)性火災(zāi)和其他未查明火災(zāi),這一步主要是為了將事故進(jìn)行分類匯總,選擇“分組匯總”,按照組類進(jìn)行排序,如下:

四、數(shù)據(jù)可視化
數(shù)據(jù)處理加工完畢,下一步就是數(shù)據(jù)可視化了,因?yàn)檫@次數(shù)據(jù)比較簡單,沒有很復(fù)雜的邏輯結(jié)構(gòu),因此直接點(diǎn)擊創(chuàng)建組件,選擇合適的圖表類型,然后拖拽對應(yīng)的指標(biāo)到坐標(biāo)軸,最后經(jīng)過一些美化就基本完成了。
這里可能比較費(fèi)時間的就是制作全國和四川省的山火數(shù)據(jù)地圖,好在FineBI可以直接匹配地理緯度,然后為了實(shí)現(xiàn)點(diǎn)擊四川省就能展示該省的數(shù)據(jù)情況,就要添加一個鉆取,將四川省的對應(yīng)地理緯度進(jìn)行自動匹配,就可以實(shí)現(xiàn)了地圖鉆取了。
這一步可能比較難懂,大家如果感興趣可以去官網(wǎng)上搜搜教程,跟著教程做起來還是很簡單的。
最后,就是本次分析得到的可視化結(jié)果:
1、全國2019年森林火災(zāi)分布圖

從全國2019年森林火災(zāi)分布圖里分析,較為驚訝的是森林火災(zāi)最嚴(yán)重的地區(qū),并不是四川、云南等地,而是集中在湖廣兩地,四川大概處于第二檔的位置,除此之外內(nèi)蒙古、陜西和安徽也屬于森林火災(zāi)的高發(fā)省份。
而鉆渠到四川省的森林火災(zāi)分布圖后會發(fā)現(xiàn),火災(zāi)高發(fā)地則集中在德陽、遂寧、樂山、內(nèi)江四個市,瀘州、廣元、成都等地也經(jīng)常發(fā)生森林火災(zāi),這幾個市應(yīng)該是重點(diǎn)盯防森林山火的地方。
2、歷年來四川省森林火災(zāi)情況與全國的對比圖

首先是歷年來四川省發(fā)生森林火災(zāi)次數(shù)占全國次數(shù)比、四川省傷亡數(shù)占全國數(shù)比的組合圖,柱狀圖代表森林火災(zāi)次數(shù)占比,折線圖代表傷亡數(shù)占比。
從圖中可以看出來,2011年之前四川省的森林火災(zāi)占比和傷亡占比都不高,均不足10%的占比量;而2012年之后,四川省的森林火災(zāi)情況急轉(zhuǎn)直下,傷亡占比最高占到全國的50%以上,而森林火災(zāi)次數(shù)占比也基本在11%以上,居高不下!
啟方特意上查了一下資料,2012年四川的森林火災(zāi)還真是不少,1.27瀘州森林火災(zāi)、5.2涼山火災(zāi)等等,當(dāng)時可以說是全國震驚!
3、歷年來四川撲救人數(shù)與傷亡人數(shù)對比圖

折線圖代表的是歷年來全國撲救人數(shù)與傷亡比,柱狀圖則代表四川省的撲救人數(shù)與傷亡比,如果柱狀圖高于折線圖,則說明該年四川省撲救森林火災(zāi)的難度大,傷亡人數(shù)多。
可以看出,基本上四川省的撲救人數(shù)與傷亡比是低于全國平均水平的,但是還是可以看到2012年出現(xiàn)了例外,四川森林火災(zāi)造成巨大的人員傷亡遠(yuǎn)超了全國平均水平;此外,2015年時也出現(xiàn)了持平現(xiàn)象。
4、歷年來發(fā)生森林火災(zāi)的事故原因分析圖

從事故原因中可以看出,造成森林山火的最主要原因就是燒荒燒炭,一方面地方要發(fā)展經(jīng)濟(jì),靠山吃山靠水吃水;另一方面,過度的燒荒造成了大范圍的無監(jiān)管地帶,很多地方都缺乏必要的監(jiān)督和指導(dǎo),因此造成了很多場森林大火的發(fā)生。
其次,我們還能看出上墳燒紙、野外吸煙等也占了很大的比重,這就是我們能夠盡量保證降低的事情了,提倡文明上墳、不野外吸煙,同時注意在野外要掐滅火種,才能不留火災(zāi)隱患,才能讓我們的消防人員、護(hù)林人員等少一點(diǎn)危險(xiǎn)!
以上就是全部分析過程了,謹(jǐn)以此文紀(jì)念本次救火犧牲的英雄們!