未來有望借助“大數據”應對霧霾天
2013年剛剛過去的兩三周里,中國的許多城市經歷了一場被動的“戰爭”——全民應對霧霾天氣。在北京,政府不得不以工地停工、公車停駛、工廠停產等種種措施,盡力減少各種污染物的排放。“霧霾”在這段不短的時間里成了公眾熱議的焦點,但是“十面霾伏”的敵人來自何方,最高時將近1000微克/立方米的空氣指數究竟是怎么產生的,對大多數公眾來說,一直是個模糊概念。
環保部門分析,首先,污染物排放量大,燃煤、機動車、工業揚塵,這些污染源排放量大,是造成空氣嚴重污染的根本原因;其次,擴散條件不利;第三,區域污染和本地污染“貢獻”疊加,PM2.5污染區域性及相關聯區域污染相互傳輸,是重污染形成過程的重要因素。
那么,燃煤、機動車、工業污染和揚塵究竟各自“貢獻”了多少PM2.5、PM10?是否能夠有更準確的數字?因為目前的數字都是大致而已,而且不同的研究機構發布的也各不相同。
“大數據”無疑是近來較熱的一個詞。各種各類有關計算機、信息技術的論壇、講座上,大數據都是被提及最高的詞語之一。在不久前舉行的“2012中國計算機大會”上,“大數據”是出現頻率最高的一個詞,幾乎每個主講者、每場論壇,都談到了這幾個字。
圍繞大數據的圖書,也借勢出現。與內容相呼應,這些書都厚似磚頭,數據量很大。涂子沛的《大數據》一書,在其中算是通俗易懂的。作者在美國留學之前,在國內的省市縣幾級政府工作過,到了美國之后,做過職業程序員,現在是美國一家公司數據中心的主任,這種人生工作履歷,使他把技術、社會相互促進交替上升的過程敘述得清晰明白。書中涉及的數據應用實例,信息充分,圖表直觀。讓人與北京空氣污染聯系起來的,是美國通過數據分析,讓交通事故死亡下降的例子。
2011年7月26日,《紐約時報》刊登了一篇文章,里面有這么一段話:“截至2010年,中國擁有7800萬輛機動車,大概相當于美國的三分之一。但是根據中國警察部門的報告,2010年有7萬人死于交通事故,是美國的兩倍,真實的數據可能還要高得多。兩國的交通安全專家認為:美國的數據非??煽?,統計了每一宗死亡案例,但中國的地方警察部門存在少報、瞞報的問題,只有一部分交通死亡的數據最終進入了官方的報告。”
美國是汽車大國,從1960年到1965年,交通事故死亡人數每年以近30%的速度上升,1966年突破了5萬,成為當時關注的焦點。有人甚至預測,到1975年,這一數字會達到10萬,但事實上,這個預測沒有成為現實。功勞是美國交通安全管理局(NHTSA)的循“數”管理。這個管理辦法起源于1966年,在突破交通事故5萬人之后,他們建立了“交通事故死亡分析報告系統”,交通管理局也因此成為美國政府最早開始大規模收集數據的部門之一。
如今,2009年美國交通死亡的相關數據在管理局的網站上就可以查到。有各種數據對比表格,比如某一天,某個時間段,是因為單車事故,還是多車相撞,清清楚楚,尤其是酒后駕駛的數字,加黑處理更直觀。在天氣和路況對比表格中,可以查到雨天晚上有燈光時或者雪天黎明時、正常天氣晚上無燈光時,諸如此類情況下的交通死亡數字。
一年一個地區的數據雜亂無章,但是跨年度、跨地區的數據越來越多,規律就浮出水面。于是改變某些地點的坡度,加大安全帶佩戴檢查力度,循“數”管理。同時,NHTSA還將數據公開,仁者見仁,提出多種交通管理新辦法。
在《大數據》一書中,類似這種社會應用提高社會管理水平的例子,比如如何降低紐約地鐵內的犯罪率,醫保制度如何更完善等還有很多。此外,也有沃爾瑪為什么會將尿布和啤酒捆綁銷售、每次颶風來臨之前為何要加大一種小甜品的倉儲等商業銷售案例。當然還有奧巴馬利用數據分析有效爭取選票,兩次競選成功的數據功勞。
美國數據治國基礎源于《信息自由法》,這部長達十幾年,經過幾方人士不斷妥協、抗爭、再力爭才通過的法律。公民有了知情權、政府有了公開信息的義務,數據才變得像資源一樣被開采并且能夠被利用,否則,數據分散、隱藏在各個地方,之后的挖掘、可視化、應用都是瞎扯。
由此看來,依靠大數據分析北京或其他城市空氣污染的形成及對策,任重道遠。
首先,就是數據的來源。高耗能企業的生產規模、排放量這些數據是否層層上報,準確統計?掌握此數據的部門是否能向社會公開?北京500萬輛汽車所加汽油到底有哪些成分,產生的尾氣對空氣污染指數的“貢獻”率到底多大?
目前似乎這些都還做不到。中共中央政治局常委、國務院副總理李克強在談到北方地區大面積空氣污染嚴重時,強調必須有所作為,同時公開、透明并及時向公眾公開了PM2.5的數據,提醒公眾有污染,損健康,要加強自我防護。要樹立全民意識,需要全民參與,共同治理。
確實,從1月10日開始,北京出現持續重度污染天氣之后,“環保北京”、“氣象北京”、“北京環境監測”、“平安北京”等政府官方微博第一時間發布相關信息。雖然這些只是提示性的信息,也算走出了一小步。
不過,更進一步的信息,比如按照《北京市重污染日應急方案》,污染最嚴重的區縣停駛30%公車,到底有多少公車停駛,相關部門都一直沒能給出確切的數字。
大數據收集、挖掘、應用是技術問題,而數據公開與否就是態度問題了。
翻看著北京極重度污染幾天中官方發布的各種干巴巴的污染指數,很羨慕《大數據》一書中的幾個圖表,一個是1850年代,南丁格爾這名英國的戰地護士,在考察了在克里米亞戰爭中英國士兵死亡情況后,作出的簡單圖表,清晰地反映出“戰斗死亡”和“非戰斗死亡”的懸殊對比,由于醫療衛生條件惡劣導致死亡人數大大超出直接陣亡人數,這張圖表直接促成了英國政府建立野戰醫院的決定。
還有一張出現在2010年2月1日《華盛頓郵報》上,當時,奧巴馬宣布了聯邦政府新的年度預算。《華盛頓郵報》利用可視化技術,制作了圖表,用線條的粗細表明各項收支金額的大小,左右兩列表示收支,錢從個人所得稅、企業所得稅、消費稅還是遺產稅來,向哪里去,是用于國防、社會保障、醫療還是債務利息支出,一目了然。
2012年2月,《紐約時報》又用“圈圈”對2013年聯邦政府的預算進行了可視化展示。他們用圓形的大小表示金額的多少,顏色表示增減,綠色代表增加,紅色代表縮減,變化額度越大,顏色越深。
這些直觀的圖表是大數據可視化的結果,如果想通過圖表看出污染源在哪兒,停駛車輛有什么樣的效果,還得耐心等待,因為我們目前第一步還沒有邁出——數據公開。