別把“大數據”演繹成“大神話”
“大數據”,眼下熱得很。從某種意義上看,現在或未來,“得數據者得財富”,甚至“得數據者得天下”,并不夸大。因為,“大數據”不是數據大和數據多,而是從繁雜數據中摸索出規律性并加以合理應用的計算分析能力越來越“大”。
不過,“大數據”并不神秘以前無法處理的海量數據或沒當做數據的東西,因為計算機計算能力的進步,現在都可以分析出子丑寅卯了。很多人逛超市,其路徑與購物之間存在數據關系,而據此調整布局,就會促進銷售。美國有的超市把影碟與尿布放在一起出售,就是因為他們通過“大數據”分析發現,來為孩子買尿布的大多數年輕父母,喜歡順便帶盤影碟“慰勞”自己。
如果以為有了“大數據”就沒有解決不了的問題,那更是一種誤解。人們的思想意識與行為模式,不同國家的存在與發展,都是復雜、曲折、獨特的,計算機不可能一一描繪清楚。而期望用“大數據”來解釋并指導世間萬物,就頗似此前用基因等生物密碼來解釋、調控人類行為模式的企圖,看起來客觀中立,實質上以偏概全。“大數據”再“大”,也是設計者、分析者、使用者在那里說了算“大數據”并不能完全擺脫人們的曲解、隔閡和成見,再“大”的“大數據”,也會因人的因素而不夠中立、全面和公正。
“大數據”潛在的負面效應,也是不應忽視的。例如,最近“大數據”被用來預測臉譜網用戶的個人信息(包括性取向、種族、宗教和政治觀點、性格特征等),而這些高度敏感信息,完全可能因雇主、房東、政府部門、教育機構、私營組織等的選擇性使用而對個人施行歧視。
回顧這些年的“新浪潮”理念、理論和技術引入我國后,正效應的確不少,可也有一些值得注意的教訓。如,在對其激情頌揚和推介中,往往缺乏不同意見和善意提醒。就“大數據”而言,國際上的質疑并不少,“大數據時代”的作者維克托就又寫了一本叫《刪除》的新書,強調大數據時代的信息取舍他稱“遺忘是一種美德”該記的記,該忘的忘。可見,如果把“大數據”提到不恰當高度甚至神化,對用好“大數據”必是有害無益。