專訪拉手網CTO官沖:電商大數據 分析先行
原創石油也稱黑色金子,開始的時候人們并不知道它的價值,它只是一種粘稠的、深褐色液體,是剛開采出來未經提煉或加工的物質。但隨著蒸汽機的發明,古老的生產工具完全被顛覆,***次工業革命來了,這種黑色金子真正被人們認識的發現,并成為推動當今社會的主燃料。
信息社會,數據的價值不容置疑,但如何用好這塊數據金礦,還有待挖掘。
拉手網CTO 官沖
2014年,是大數據進入落地之年。究竟大數據在企業一線會有怎樣的應用,51CTO記者帶著這樣的疑問采訪了拉手網CTO官沖先生。
大數據的處理與挖掘
在大數據誕生之前,企業已經在運用商業智能工具在分析自己的數據了。在固定的業務數據模型下,企業可以根據一些設定好的數值范圍進行分析。得到的結果,很大程度上也是真實可靠的。
但對于電商行業來說,數據量呈幾何數的增長,讓以往的數據處理方法顯得捉襟見肘。官沖先生給出了一組數字。截止2014年,拉手網擁有5000多萬用戶,每天光產生的日志吞吐量就超過了10億的量級。這里面有用戶的訂單,有他們的評論,還有他們對于個性的詮釋。
以前我們沒有如此大量的數據進行處理,大家認為增加計算資源就夠了。但現在如此大吞吐量的數據,確實對任何一家來說成本都會非常高。而采用分布式計算后,拉手網可以使用PC Server來應對每天產生的海量數據,這種成本就要低上很多。
數據分析人員的春天
大數據時代,數據分析人員(或者叫數據科學家)將會變得更加稀缺。這部分人是一家企業的核心技術人員。
在拉手網,有一支20人左右的大數據分析團隊。他們中,一半是技術人員出身,對數據特別敏感,喜歡分析數據。這些人一旦接觸到商業模型,就能迅速得出分析結果來。而另一半人,則是商業模型方面的人才,對于顧客心理等商業內容更加熟悉。這兩類人,平時在拉手網是如何協作的呢?
官沖告訴51CTO記者,平時會讓他們按照各自的強項工作。比如技術人員,會用已有的數據形成各種報表,或開發出各種數據決策工具。而商務人員,則會在數據的基礎上做一些天馬行空的想象。當他們兩撥人***碰撞到一起,肯定會得出很多有意思的方案。
為了得出這樣的決策方案,數據分析人員可以三個月不跟CTO官沖匯報工作。但是一旦方案達成,就必須要有數據來說明這么做,我們可以增加多少的銷售額。這是官沖給他的團隊灌輸的意識,這是一個CTO想要得到的東西。
大數據的到來,讓企業擁有了對所有維度數據的計算能力。但這些分析出來的東西對你的商業支撐到底有沒有作用,這個大數據還無法判斷。可能你按照某個數據模型,分析出來產品應該是這么回事。但他真的適合這個企業嗎?官沖認為,還是需要真正懂得商業規律的人來做判斷。
大數據時代,企業將會需要越來越多的數據分析人員。
行業大數據的安全性
數據的安全性和完整性,是企業核心數據必須考慮的要素。拉手網對此按照三個層面來做,***個層面:基礎硬件。在數據保存上,實現數據的備份,大部分公司都能做到。第二個層面是關鍵數據的管理,哪些人能看到這些數據。這個層面是公司投入***的一個,在數據的管理上,很多數據泄密可能是內部原因。有一些內部的人員看到他不應該看到的數據,或者獲得他不應該獲得的數據。
第三是在審核上。數據審核包括兩個方面,一方面是完整性的審核,還有他的正確不正確,或者說他有沒有被不安全的使用。可能有一個數據產生了,會有審核的程序先來驗證一下這個數據產生正確還是錯誤,是不是應該在這個時候被產生出來。
拉手網對于大數據安全,也使用一些常規手段。比如內網外網分離。在內部,正在建立一套數據管理流程,包括大數據的審計。當我們剛發現一個數據被篡改,或者被非法使用的時候,這個審計機制會啟動報警。
后記
對于一家電商網站來說,拉手網需要對用戶進行細分。要知道用戶買了什么,從哪里來,在未來會有怎樣的購物需求。這些東西,對需要電商大數據的支持。
無論從數據維度上,還是數據長度上,都需要拉手網跟蹤更多數據,分析更多數據,得出更多的營銷方案。在大數據時代,數據分析顯得尤為重要。