2018,怎么緩解大數據的尷尬
關于大數據,最近爆出的一個笑話:在電影業一次內部行業會議上,一位巨無霸級別的電影業發言人說:通過數據挖掘,我們發現不同觀眾的相關賣品偏好。比如《芳華》的觀眾比《戰狼Ⅱ》觀眾消費了更多的熱飲。這些都是之前我們不知道的,也是無法預測的。

上面這樣一個基于兩部影片的觀影數據分析得出來的結論,看似客觀正確,實則因為模型不完善(缺少觀影季節的考量)等原因,而鬧出笑話。
在近期,我們在給金融科技做盤點的時候,就發現大數據自身就是一個“尷尬”。我們找遍新聞,也沒有發現這個詞有什么特別值得說道的地方。只能靠著一點時政資料湊齊了這個關鍵詞的盤點。
2017年,大數據如此重要,卻又如此沒有料。
大數據模型不完善,是因為根基不牢大數據一直不溫不火,和他的發展缺陷有很大的關系。雖然大家極力看好它,但未能迎來行業的爆發。
和一些做大數據的朋友聊天,他們甚至會很直白地吐槽自己家的數據模型。
“那些所謂的數據模型之類的鬼東西,你只需瞄上一眼,就能頭疼一整天。模型里的數據巨大無比,線索邏輯紛繁復雜。很多數據看似很重要卻極其無聊,對結果判斷毫無意義,食之無味棄之可惜,雞肋一般的存在。”
“說實在的,根本原因不在于技術的落后,而是整個行業的發展根基太淺,無法對數據的有效性進行勘誤、歸納和合理解釋。”
“粗略地說,合理的大數據架構是,數據模型完善,能根據特定領域做出全面合理的數據精簡,去掉無關數據和干擾數據,梳理出一條合理的客觀建議,并根據數據分析師的主觀判斷和勘誤,再總結出合理的結論,對相關行業做出準確的預判。”
“現在呢?本來數據模型都存在這樣和那樣的漏洞,卻還想著數據處理的完全自動化。”
“而完全依靠客觀數據,完成所謂的人工智能演算,那都是扯淡的事兒。”
“剛才說的那個《芳華》和《戰狼Ⅱ》的笑話其實就是一個看似客觀,實則可笑的分析結論。”
“這是因為,大家一說到大數據,就太拿數據想當然了。如果只靠著這點意識去做消費金融領域的數據分析,肯定有很多投資人被坑得底兒朝天!”
“所以現在掙錢的還是那些靠著倒買倒賣用戶資料的數據公司,一個數據包,加點水分,到處賣,收益***。”
“不過,最近似乎也沒那么容易整了,因為官方越查越嚴,有些所謂的大數據公司搞不動了,怕是要涼了。”
物聯網或許是大數據公司的真正機會“除了行業經驗的累積,還需要更多數據做線上支撐。”
“當然,并不是說數據越多越好,而是說,線上的數據越豐富,越有利于我們組織有效數據。”
“核心問題就在于,如何產生大量的有效數據。”
“有效數據,簡單了說,就某個領域,比如,消費金融領域的某一個小細分的消費品的相關數據,在合理組合和解構之后,對行業發展做出合理預判,對投資人預期負責的數據。否則,數據越大,負擔越重,越成不了事兒。”
積累經驗到什么時候才算是個頭呢?
“或許要等到物聯網時代的真正到來。”
為什么?
“物聯網可以讓更多的消費金融數據和物流數據線上化,個人消費信用信息也將進一步線上化,數據的歸集和處理將更加高效和全面。”
“不過,隨著移動支付的快速發展,更多人的金融消費能力在線上就基本被呈現了出來,包括個人的消費習慣和個人征信信息都被線上化,而由此產生的物流信息、住房、貸款信息等都在逐步完成***線上化,這些對大數據來說,都是極好的機會。”
“大數據行業機會很大,但大數據是一個不穩定的行業,因為一切的數據都歸結到機器里,而機器由人來掌控,相關的操作風險完全看自己的風險意識和人品。行業隨時爆發大規模風險,運氣好只影響數據安全,運氣不好,很企業和個人的信用會破產。這會給行業,甚至整個社會帶來巨大的災難。”
“因此,從業企業的相關準則需要進一步細化和規范,對人也需要有個職業操守方面的管制。”
什么樣的人怎么用數據,其目的和效果都是不一樣的。
這又和一個大數據相關的段子有點關系,正好段子開頭,笑話結尾,也還算圓滿。
俺家鐘點工說:“俺兒子又被老師訓了。”俺問又咋啦?她說:學校請了個政法大學的教授來給孩子們講課,說還是個名人呢,見天在電視上忽悠。他告誡孩子們不要打架,他說他統計過,打架斗毆死了的人百分之九十五以上都是先動手那個,然后問孩子們這是為什么?俺兒子說因為沒死的說是死了的先動手的。