成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

巧用數據,助您在移動創業的紅海中突圍

原創
大數據
在這個快速消費的時代,互聯網已經和人們的日常生活緊密相關,隨著人們的需求和產品功能的細分,消費被重新定義,如何"留住用戶",成為牽系企業于互聯網立足生存的首要課題。本文將從兩個方面:分析和思路、技術實現,講述如何把您的用戶留下來。

【51CTO.com原創稿件】在這個快速消費的時代,互聯網已經和人們的日常生活緊密相關,隨著人們的需求和產品功能的細分,消費被重新定義,如何"留住用戶",成為牽系企業于互聯網立足生存的首要課題。本文將從兩個方面:分析和思路、技術實現,講述如何把您的用戶留下來。

【講師簡介】

[[173435]]

郭煒: 畢業于北京大學,加入易觀智庫之前,曾任聯想研究院大數據總監,萬達電商數據部總經理、并曾在中金、IBM、Teradata公司擔任大數據方向重要崗位。在大數據采集、存儲、處理、挖掘、應用研發等方面具有豐富的理論和實踐經驗,對大數據前沿領域研究,包括視頻、智能Wi-Fi, Beacon等大數據軟硬數據處理一體技術有獨特的見解與實踐。在電商、移動互聯網、商業地產、百貨、移動通信、零售、院線等多個業務領域大數據方面具有搭建團隊、系統以及分領域的分析與算法經驗。

生命周期管理

想要留住用戶,首先要回答三個問題:一,這個用戶是從哪里來的。二,流失的用戶去哪兒了。三,針對這些流失的用戶如何爭取回來。回歸到如何做數據分析,主要有四個步驟:生命周期管理、運營轉化分析、用戶分析、應用評級。如下圖所示:

“7天法則”分析不同事件下的用戶留存

使用“7天法則”,首先是,分析每一次活動之后,七天之內用戶留存的趨勢怎么樣,這個用戶在七天之內是不是又再次激活了App,還是沒有再使用。分析這些用戶單次的使用時長,包括日、周、月啟動次數的分布,進而分析出來到底哪些人是羊毛黨,哪些人是忠實用戶,哪些人會留下來成為App用戶,而哪些人是不值得挽留的。不管是自己做還是使用第三方工具,都會分析這些趨勢。

第二,什么時候該換產品思路了。很多產品,特別是在初期,可能在七日內的留存不到10%,等于這個產品的有效價值并沒有體現出來,這個時候要么需要調整產品思路,要么調整運營思路,證明產品價值并沒有吸引最終用戶留下來,這個時候可能要對產品價格做比較大的調整,認為這個方向沒有問題,進行切口的調整和切換,繼續再向這個方向走。

運營轉化分析

運營轉化分析看似一個簡單的漏斗分析,每個層次都有它的故事,都有它所關注的重點。

營銷渠道:哪些是你的用戶?

瀏覽運營位:哪些用戶看了就走?你的老用戶是怎樣做的?

提交訂單(購物車):哪些用戶沖動消費了?

支付訂單:沒支付的這些用戶到哪里去了?

分享:哪些內容具有傳遞性?

通過支付轉化率和渠道來源用戶分析不同營銷渠道的質量,輔助決策在有限的資源下優選哪些渠道推廣。分析頁面不同位置的轉化質量,輔助決策產品、運營改進,獲得更好更好的效果。

用戶分析

用戶分析其實就是分析你的用戶長什么樣?從哪里來,到哪里去?通過10億終端的覆蓋,通過算法模型計算出你的應用用戶特征,性別、年齡…

應用評級

認清大局,才認清自己,你的評級是多少?你的用戶價值是多少?

看行業趨勢:確定是否逐漸遠離風口。看行業均值、TOP10:市場是否已被領頭羊蠶食?長尾幾無生存空間?看行業排行:自己是否還有機會?尋求新的切口?

如何實現大數據平臺

郭煒以易觀為例,詳細講解了大數據平臺實現的方法。

首先,底層在讀取數據的時候,SDK嵌入到每一個開發的App里,包括H5。數據讀取完成以后,肯定還需要把數據收回來,每個開發者和創業者建立自己的平臺一定也有一個接收端。易觀目前這個量級用的是Openresty(Lua),中間用Lua做了一些在SDK到上層相互交流的粗加工,目前是每天100億條的數據在往上傳,有時峰值可能還會更多。哪些能把有效的數據迅速采集過來,哪些數據能夠迅速對客戶端做出一些反饋,要通過Openresty、Lua做一個高效的返回機制放過來。直接進Kafka,圖中使用了幾個虛括號,因為現在使用的是混合云,主要混合了三個地方:一,通過公有云采集收數,因為在接收端的帶寬是兩倍,從這里做收數,通過一些光纖打通的方式打到線下,但是由于像光纖的方式如果萬一出現問題,形成單點故障,還有一條互聯網鏈路做保障。在收數端的Kafka收完后,還會在私有云有一個Kafka,兩個做對接,在對接中間做了一個開源小工具,Kafka中間有一個Url的工具能夠去對跑,但實際上這個工具是不靠譜的,特別是在數據量級比較大的時候,對跑會出現各種各樣的企業問題,后來易觀自己制作了一個小程序,為了保證中間傳輸上的穩定,做了一些壓縮,可以實時傳輸過來,目前延時大約在5-10秒的范圍,同時能夠從線下收數到整個線下集群。

Kafka往上,易觀和大多數大數據企業是類似的,一個是使用Hadoop/Hive,因為數量比較大,像MR把數量變小,變成ODS,其實是變成底層的基礎數據,會在PDS做匯總層數據。再往上就是IDS,為了做產品體系查詢。另一種是做Storm,Spark易觀目前還沒有完全做到自主優化,因為數據的量級非常大,每天大約100億,數據在查詢的時候,上面還有一個大數據查詢,經過三個匯總以后,到這一層動輒也是千億條的數據。舉個例子,對于產品來講,尤其是云端分析師,想看到上個月晚上9點到10點之間,標簽是游戲玩家,淘寶資深購物人員,經常打開App的排行榜是什么,這個查詢還是很容易的業務,但真正落成千億條的數據查詢卻非常難,并且還希望做成一個比較好的查詢,希望至少在分鐘之內的范圍,這個要求就非常難。這個查詢如果在Hub里,一般是以小時來計,怎么能夠放到產品里,把分鐘級別的查詢反饋過來?目前,在中間做了一個簡單的查詢引擎(目前是查詢目錄),根據企業的數據量級分到不同的查詢引擎里解決相關問題,例如現在的GP,其實要求的是一個貴族開源的軟件,好處是在千億條大數據查詢的時候非常穩定,兼容性也很好,但是對硬件的要求很高,不是每一個初創企業能有錢去做GP集群。Impala相對更加簡單一些,要求硬件沒有那么復雜,但時效性不如GP好。對一個企業內部,看上去整個集群大小有千億條,但真正對于某一個App或對于某一個開發者來說,開發者要分層,發現有了這些大的頭部應用,至少百億。而小的開發者完全不用,目前很多還有日活不到1萬的開發者,把它直接放到這查詢就可以了。

數據調度資源也很重要,易觀自己用的EMP,對資源做一些調度,能保證每天有內部分析師查詢,在EMP里和Hadoop做了一些底層的接口對接,保證任務按時優先處理完。除此之外,內容數據量越來越多,數據越來越復雜,中間必須要有主數據管理、源數據管理,像數據地圖等等一些相關工具。這些都包含在整個產品體系里。

幾個技術難點

關于SDK,首先是不能丟數據。用戶網絡情況不太好的時候,在本地可能需要一個Cache,但是不能做無限大的Cache,用戶就會把App卸掉,因為存了太多的無用數據,哪些數據要留存下來,哪些要做循環處理,都是需要注意的。

第二是如何不變成DDOS。把數據放在Cache,而且越來越多,服務接收能力還不強,會形成非常大的DDOS。這個時候就需要去控制。在SDK上傳的時候要做防火墻,真正數據在傳到云端時,如果App上傳的頻次過高本地要做屏蔽,如果一旦形成DDOS,就沒有辦法很快把App更新,基本上服務器這套機制全部就死掉了,在這個地方要有一個防火墻。上傳數據不是單向,而是雙向,把數據傳上去的同時要有交互,要拿到云端的配置,特別是在中心云,能看到很多雙向機器,當出現一些問題時,在云端是可控地把數據屏蔽掉,這樣才能保證自己的數據安全,如果只是一個小開發者可能量比較大,但日活如果到千萬以后,需要在這個地方做一個很好的交互,讓云端的一些配置能夠很快反饋到SDK,把數據上傳和拐點機制能夠做更新,保證不會形成DDOS,比如作為開發者來講或其他部門把點埋錯了,或者出現一些問題時,能控制好相關的數據。

此外,如何做到最小,如何將H5與APP互相調起,也是SDK需要注意的問題。

在接收端,需要注意的問題有:如何高并發接收數據,如何可以跨互聯網傳送高頻大數據,如何可以做到極致實時。而關于用戶畫像,如何基于小數據算大量用戶畫像,如何計算用戶標簽,如何知道你用戶的用戶畫像,是需要注意的問題。

關于實時大數據查詢,如果面對的是上千億條的數據,可以考慮模糊計算,先抽樣,郭煒的建議是做分層抽樣。第二是做預先計算,在不同的場景里,用到一些工具,把數據變成打橫的,而不是打縱的據,這樣能做到很多。郭煒在這里舉的例子是轉化漏斗。每一個用戶的交易和點擊是一張縱向的流水表,用戶IP、事件、時間分點等,當量級變成千億條,如何保證每次都能很快過濾出來,這是非常難的,對于這種情況,易觀會在這種縱調做完以后打橫,通過每一個事件(過去都是事件流水),從ID到時間,做完打橫以后會變成用戶ID、時間周期,每個事件會變成0和1。打橫以后會把原來的查詢變成并和交的查詢,去關聯化,最后再去做整個數據查詢,速度會快很多,這也是大數據查詢經常用的一種方法。

每一個不同的用戶,數據來源和大小不太一樣,當自建一個大平臺時,每個業務部門的分析也是不一樣的,究竟哪些業務部門真的需要用到這么復雜的GP和Impala,哪些是真的實時性要求高,但數量非常小?郭煒的建議是在每一個大數據,特別是真的數據做得很多以后,每個地方至少做一個數據擴容,最終才能夠根據查詢的情況選擇適合自己的大數據工具做查詢,有的東西用GP合適,哪怕簡單寫一些日常規則或者基于后期統計,把查詢做起來,都非常有助于整個大數據查詢平臺的整體效率,從而實現高性價比的大平臺策略。

易觀簡介

易觀是中國互聯網市場領先的大數據分析公司。自2000年成立以來,易觀打造了以海量數字用戶數據及專業大數據算法模型為核心的大數據與分析師服務生態體系,并致力于幫助所有擁有互聯網產品及服務的企業,洞察自身的產品和用戶,對標競爭和市場,并通過對數字用戶資產的持續運營,實現增收,節支,提效和避險。

本文由郭煒于2016年8月,在WOT2016移動互聯網技術峰會數據分析專場《如何巧用數據在移動創業的紅海中突圍》主題演講整理而成。WOT2016大數據峰會將于2016年11月25-26日在北京粵財JW萬豪酒店召開,屆時,數十位大數據領域一線專家、數據技術先行者將齊聚現場,在圍繞機器學習、實時計算、系統架構、NoSQL技術實踐等前沿技術話題展開深度交流和溝通探討的同時,分享大數據領域最新實踐和最熱門的行業應用。了解WOT2016大數據技術峰會更多信息,請登陸大會官網:http://wot.51cto.com/2016bigdata/

【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】

責任編輯:趙立京 來源: 51CTO
相關推薦

2016-08-19 10:02:57

數據移動

2016-07-29 14:17:28

易觀方舟紅海突圍用戶畫像

2014-08-12 14:19:36

2017-09-13 10:47:51

CDN

2010-09-02 19:55:35

斐訊數據通信

2013-09-18 13:28:15

云計算云平臺移動開發

2023-12-20 09:00:00

網絡安全密碼安全

2014-11-10 09:50:21

金融移動化

2013-08-28 10:12:36

移動創業草根創業

2017-09-28 15:42:03

2017-07-03 09:05:17

高性能視頻調度

2016-06-30 11:03:37

2017-04-17 10:13:27

云計算

2015-06-17 11:44:42

微天使聯盟

2016-06-08 15:39:56

CDN

2017-02-27 08:47:06

2013-10-15 10:30:33

2017-01-02 17:27:46

網絡加速移動網絡加速華為HDG

2019-12-16 14:11:14

數據科學數據集數據分析
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产伦一区二区三区久久 | 欧美日韩亚洲国产 | 日本久久综合网 | 综合久久av | 97起碰 | 一区二区三区国产精品 | 国产精品夜色一区二区三区 | 亚洲一区二区三区在线免费 | 欧美一区二区三区小说 | 国产精品不卡 | 欧美在线a| 国产农村一级片 | 久久久91精品国产一区二区精品 | 久久久久一区 | 日韩天堂av | av在线电影网站 | 在线一区 | 天天曰天天曰 | 国产在线播 | 毛片入口 | 成人国产在线视频 | 免费一级做a爰片久久毛片潮喷 | 日韩二区 | 久久成人高清视频 | av中文在线观看 | 亚洲精色 | 中文字幕亚洲欧美日韩在线不卡 | 亚洲激情自拍偷拍 | 成人依人| 高清一区二区三区 | 黄在线免费观看 | 国产成人精品一区二区三区视频 | 亚洲精品乱码久久久久久9色 | 国产精品国产三级国产播12软件 | 97国产精品视频 | 国产精品美女久久久久久久网站 | 在线高清免费观看视频 | 色综合视频 | 欧美视频一区二区三区 | 瑟瑟免费视频 | 国产一二三视频在线观看 |