出版社如何玩轉大數據
最近有個段子在微信上流行,說世界上最早運用大數據的是中國的“戰神”——孫臏,他曾用敵營做灶 的數量來判斷對方軍隊的數量,從而指導打仗。只不過在當時這樣的數據少之又少,而能夠真正利用這些數據的人便會被人尊為智者。如今大數據洶涌來襲,正在改變著世界,出版業自然不能例外,部分出版單位已開始涉足大數據分析。但對于大多數出版單位而言,大數據依然很神秘。
提起大數據,想必大家已經不再陌生。大數據的挖掘越來越多地滲透到生活的方方面面,從數據科學家幫奧巴馬技術性擊倒羅姆尼,到成功預測2012年50個州選舉結果的內特·希爾沃(Nate Silver),時下最火爆的美劇《紙牌屋》就是基于大數據制作的。如今大數據已經落地,改變了很多行業的走勢,同時改變了人們的生活。在不久的將來,大數據挖掘獲得的結果也許比一個行業老手的直覺判斷更準確。
圖1:銷售數據驅動出版大數據
出版單位有哪些核心數據
出版社擁有自己的大數據,從選題策劃開始,貫穿整個出版流程。令人遺憾的是,很多時候我們并不關心。
什么是大數據?大數據是基于互聯網的,是由無數個小數據匯集而成的,如靠著電腦中的cookie記錄網民的所有瀏覽及搜索行為,并且會定位地理 位置、瀏覽時間和系統數據。通過對這些數據進行分析,可以給這些網民貼上不同的標簽,比如科技迷、讀書狂、體育迷等,并依此進行精準營銷,這就是大數據分 析。
下面說一說出版社到底有哪些核心數據呢?
選題、印制、發行、重印、銷售、人力、辦公,在這里用了一棵樹來表示,其中銷售數據是我們所有其他數據的源泉。未來,所有環節都應該由銷售數據驅動(圖1)。
傳統意義上,出版社是從選題策劃開始整個流程,但是現在這個流程應該是循環往復的,從數據驅動的選題策劃開始,各環節的數據監控和分析貫穿始終,當然所有環節都少不了人和團隊的參與,這樣就可以實現數據驅動運營(圖2)。
在此,筆者收集、整理了許多出版社的核心數據,這些數據主要可以進行三類分析:現狀分析、原因分析、預測分析(圖3)。其中,現狀分析包含:階 段性的工作匯報、促銷分析、經銷商評價、日常添貨跟蹤、工作量或者說企業關鍵績效指標(KPI)的考核等;原因分析包含:重點選題為何不能按時出版?好書 為什么不是在哪都好賣等;預測分析包含:重印書預測分析、紙張采購等。這三種分析往往會互相結合,因為任何分析都始于現狀分析,比如作者出版效率分析、品 類分析(出版社各子品類哪些應該持續投入、哪些維持、哪些放棄),新書走勢及同類書的首印量確定等。
數據怎樣驅動出版運營
用好大數據,讓好賣的書變得更好賣。
下面舉一些例子,看看現有數據是如何驅動出版運營的。
查找缺品
在這個圖書品種過剩的年代,如何確保長銷書不缺品是出版社工作的重中之重。圖4是三大網店今年一季度銷量前十名的匯總表,無須任何分析,只要把 三個網上書店的數據放在一起,就可以發現問題,第一個問題就是三個網店都有缺品,第二個問題是書店排行榜銷售前十位的品種銷量差異很大。無論實體店還是網 店,零售靠的就是品種,新書發出去只是萬里長征的第一步,有針對性地二次甚至多次回添才是銷量生生不息的源泉,才是出版社所有運營的原始推動力。針對缺品 的問題,出版社可以采取的應對措施,就是每周跟蹤前300本及上市3個月內新書的庫存及添貨比對。
日常添貨跟蹤
眾所周知,網店的系統都比較先進,系統每周都有1~2次的邏輯補貨,還有和中盤的電子數據交換對接,盡管如此,由于出版社印制周期及發貨速度的 影響,仍會出現不同程度的斷貨,實體店的二次回添更是個大問題。因此要定期對各零售店進行有針對性地補貨,具體到網店可以分成兩部分:一是網店整體庫存不 足的直接生成訂單,二是網店各倉之間內配。
經銷商評價
出版社每天都與眾多經銷商打交道,如何科學合理地對其進行評價呢?假設用信譽度、訂貨、回款、退貨率和賬期這5個指標來評價,那么出版社先要匯總各經銷商的各項指
標數據,把每項數據都進行0/1標準化處理。然后出版社來確定每個指標的權重。有了權重和標準化的數據就可以進行加權計算了,不過需要注意的就是退貨率和賬期這兩項是越小越優的指標,因此對于這兩個指標要用減法。最后得出了各經銷商的綜合平均得分。
新書首印量分析
新書首印量的確定不僅關系到出版社的贏利,更關系到成本控制,相對于印少了來說,印多了不僅不能創造預期的利潤,更會增加不該有的庫存,占用大量資金,因此對新書首印量的回顧性分析有助于后續新書印數的決策參考。
重印書分析
一般來說,重印書發貨碼洋占比應該占當年總發貨的50%~80%(視不同類型的出版社而定),重印書更是出版社的利潤來源。重印書不同于新書的 一點就是它是“有跡可循”的,在重印之前,出版社掌握著每一本書的印制、發貨及銷售數據,通過對這些數據進行分析,出版社就可以科學確定印數及印制計劃, 既要保證不斷貨,又要確保不多印。
作者出版效率分析
出版效率即品種效率,是出版社衡量一個品種、一個作者、一個策劃編輯、一個類別、一個利潤中心較為重要的指標,按照這個思路,出版社還可以做出上述各個維度的出版效率線柱圖,以供領導決策參考。
品類結構分析及選題發展方向
假設出版社有A到K共11個品類的圖書,做出矩陣關聯分析圖,橫坐標代表市場份額,縱坐標代表出版效率,圓形的大小代表每個品類的收益。由圖5 中可以看出,B屬于出版社的明星產品,出版社應持續投入資源,保持優勢;A和C屬于現金牛,雖然出版效率比較低,但占據了較高的市場份額,應該維持優勢; 第二象限的產品屬于問題產品,需要優先改進,讓其變為明星產品;第三象限的產品出版效率和市場份額都比較低,可以適當放棄,把資源投入到其他幾個象限的產 品中去。
圖2:從選題開始便可實現數據驅動運營
出版社的核心數據
數據監測發現缺品
出版物品類結構對比
數據分析分幾步
讓大家頭痛的一份報表,做起來其實可以很簡單。
通過上面的例子,大家估計已經了解了數據對于驅動出版社運營的重要性,下面談談數據分析到底如何做?
不知道出版社的同仁們有沒有遇到過這樣的情況,自己手頭有很多數據,但是要分析的時候又無從下手,或者是分析出的結果不是自己想要的,這個時候 大多數人會覺得是自己掌握的技能不夠,excel用得不夠熟練,甚至認為需要專業的統計分析軟件才能得到分析結果。但筆者要說的是,這些真的不是核心問 題,數據的分析能力不是體現在你掌握的工具上,那只是“法”而已,重要的是人的思想。信息時代,數據的收集、整理、分析和挖掘,是一支優秀團隊所應該具備 的基本素養,沒有它,工作只有兩個字——苦和累。
人們最常問的問題是:“我們遇到一個難題,用什么技巧能解決?”卻很少有人問:“我們遇到了一個難題,是不是我的表格設計或者數據記錄方式出了錯?”大家關注技法太多,卻忽略了心法。
圖6:圖表制作遵循五大原則
先來明確一個概念,我們日常做的表通常只有兩種,一種是數據明細表,也叫源數據表;另一種是統計表,也叫分類匯總表。前者不僅需要做,還必須用正確的方法做;后者卻不用做,因為他們都是可以被變出來的。數據分析可以分六步來做。
第一步:明確分析目的和思路
這是數據分析的核心,沒有目的和思路,就不知道搜集哪些數據,用哪些維度(分析數據的角度)等,一系列后面的步驟都無從談起。這一步要基于業 務、了解業務、精通業務,在此基礎上要了解出版單位的系統構成,知道系統都能導出什么樣的數據,并且深刻了解這些數據之間的關系,這樣我們才知道分析什么 問題的時候需要什么維度的數據,才能有的放矢地搜集相關數據。
中層領導是企業中承上啟下的環節,是經常做數據分析的管理層,如果他們的思路不明確甚至是錯誤的,會造成基層工作人員很辛苦。加班加點填寫大量 數據,提交上去之后,中層領導整理起來也很辛苦,但是最苦的還是高層領導,也就是親愛的老板們。他們為一份分析報告等待數日,呈報上來之后因無法看到結 果,而錯失良機;更有甚者,依據錯誤的數據分析做出錯誤的經營決策。
第二步:收集數據
一般說來數據收集主要有兩種方式,一種是由業務系統直接導入的,包含編務、印制、發行等系統;另一種方式就是手工錄入數據。
第三步:數據處理
常見的有重復及缺失數據處理、檢查數據邏輯錯誤、數據分列、字段匹配(vlookup函數)等。將不符合規范要求的數據經過上述幾個步驟的處 理,最終要得到一張天下第一表,也就是一維源數據表,我們必須要以正確的方式做出數據明細表,這個表既要規范又要滿足我們分析所需的維度,對后面的數據分 析至關重要。
第四步:數據分析
數據分析都是基于匯總表的,匯總表不是做出來的,而是變出來的。怎么變呢,除了剛才講過的vlookup、excel,另外一大法寶工具就是數據透視表,有了它,隨時可以變出你想要的各種匯總表。
第五步:數據展現
辛辛苦苦做完了數據分析,下面就說說如何展現分析結果吧!一句話概括:“讓老板30秒內讀懂你的數據”。
由于人類對圖像的理解力和記憶力遠勝于文字或者數字,所以圖表成為演示匯報中不可或缺的元素。只要能準確、直觀地詮釋數據,就是一張好圖表,不是做得越炫越好。圖表圖表,別忘了“表格”也是一種有效的展現形式。這里最需要注意的就是選擇合適的圖表(見圖6)。
講到這里,大家可能心里松了一口氣,經過了這么多步驟,終于做出了圖表,但是數據分析絕不僅僅是這樣,還是一門藝術,我們還要對圖表進行美化, 美化之前先要確保圖表五臟俱全,有觀點的標題、圖例、單位、腳注以及資料來源。圖表美化三原則:簡約、整潔和對比,實際工作中大家盡量不要用excel圖 表自帶的格式和顏色。
第六步:撰寫數據分析報告
專業的報告可以充分展示我們的工作業績以及所創造的價值。
我們交過這樣的報告嗎?費盡心力,用各種漂亮的顏色妝點圖表,然而,報告交上去,就被領導給打了回來,可以肯定的是,做這樣的報告肯定花費了很 多時間,但是存在兩個問題,一是把報告的解讀工作留給了管理層;二是沒有見解和執行建議,讓領導一眼看出,“哇,看來我們該好好在……加強了”。
數據分析報告通過對事物數據全方位的科學分析來評估其環境及發展情況,為決策者提供科學、嚴謹的依據,降低風險。
數據分析報告有三點作用:展示分析結果、驗證分析質量、提供決策參考。
還有一個容易被忽視的問題,不論是Word還是ppt展示,用表格展現的時候,一定要注意合適的數量級。讓看數據的人省下數“個十百千萬”的時間,單位標注清楚即可。
整個報告要充分結合業務,有結論有建議,報告的最后盡量讓領導做選擇題,而不是開放性的問答題,比如綜合上面的情況,我們可以采取以下3種方案解決。