大數據可視化的三大認識誤區
最近,很多企業都在談數據可視化,其受關注的程度不次于大數據。數據可視化是正確理解數據信息的***方法,甚至是唯一方式。出色的可視化產品可以讓用戶對自己目前關注的事情一目了然,并可以快速給出建議,隨時隨地分享。在大數據時代,如果你的數據展示方法不對,可能會破壞數據可視化效果。
誤區一:顯示所有的數據
盡管我們多次被告誡,大多數人并不關心你對多少數據做了多少量化指標的處理,他們不在乎你每天可以處理多少數據,或您的Hadoop集群有多大。用戶想要的是具體的或者相關的答案,并且他們希望越早得到越好。但是有些數據可視化工具,還是會把無關的數據顯示在頁面上,目的是希望接近企業所需,但事實上造成了用戶很難找到有價值的信息。
現在儀表板應用非常流行,其指導思想是可以“顯示所有狀態的數據。大多數性能是枯燥的數據展示,而多異化功能則被隱藏。其實,好的儀表板數據展示,是把重要數據做了了趣味化的展示處理。讓用戶做一個有效排序,哪些是優先處理,哪些需要延后處理。數據可視化可以達到儀表盤達不到的能力,可以更好地處理數據報告。
誤區二:顯示錯誤的數據
顯示錯誤的數據和顯示所有的數據同樣存在隱性危機。在數據可視化操作中,顯示的信息子集與數據是相關的關系。比如你關心銷售數據,您可能也關心每個地區或者個別銷售人員的銷售數據,考慮通過數據做出決策。把幾個關聯性很強的圖表進行折中處理,選擇一個圖片來展示,這實際上需要一個復雜的數據可視化能力來完成,而且相關幾個圖片的數據必須做到干凈、清晰。
誤區三:美化數據展示結果
即使你采用干凈的數據繪制圖表,你仍然會弄錯。因為特殊化的表格類型展示很少見,絕大多數的可視化需求都是用來滿足線形圖、餅圖等基本圖形。
要想美化數據展示,在處理關鍵數據字與段之間的關系時,就應該考慮把指定字段加在坐標軸上。按照組別、類別、數據時間、數據量級以及重要性進行劃分,尤其是顏色類別一定要有,并且可以自定義亮度和飽和度,確保在使用本標簽或者其他標簽的時候做到準確無誤。
為了避免失誤,***的方法是專注于你的目標。在可視化應用之前就應該考慮:我們關心什么?需要做什么?要解決什么問題?要看到怎樣的數據?以怎樣的結構和關系來展示?要突出哪些數據?當你能夠回答這些問題時,你就可以進行數據可視化的設計或者應用了。
原文鏈接:http://soft.chinabyte.com/216/12827716.shtml