SQL Server數據挖掘之如何實現Web路徑流挖掘
最近與一個客戶的開發團隊探討和學習SQL Server的數據挖掘及其應用。有幾個比較有意思的問題,整理出來
關于數據挖掘的基本知識和學習資料,可以參考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx
上一篇:SQL Server數據挖掘之理解聚類算法和順序聚類算法
上一篇解釋了聚類算法和順序聚類算法,這一篇講解一個實例,就是我們常說的Web 路徑流挖掘分析。Web路徑流是讓我們發現用戶使用網站的習慣的一種表示方式,例如我們想知道用戶是先到什么頁面,然后再到什么頁面,由此我們可以給用戶分組,并且根據他們的習慣定制更好的頁面導航設計。
按照數據挖掘的基本流程,我們一步一步來做
1.定義問題:通過分析得到不同用戶群使用網站的路徑及其規律
2.準備數據:
為此,我們準備兩個表格,分別保存客戶信息(如下)
以及客戶點擊頁面的記錄表(這里作為演示,我只填寫了一些范例數據)
#p#
3.建立模型:
準備數據源和數據源視圖
創建挖掘模型。這個業務場景,我們適合用“順序分析和聚類分析”
#p#
#p#
#p#
#p#
點擊“Finish”之后,檢查模型的設計
#p#
4.部署和處理
【備注】因為數據不多,所以看到的結果比較簡單。有興趣的朋友可以實際準備一些數據進行分析
【編輯推薦】