成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

3分鐘了解“關聯規則”推薦

大數據 數據分析
“把啤酒放在尿布旁,有助于提升啤酒銷售量”是關聯規則推薦的經典案例,今天,和大家聊聊“關聯規則推薦”,正文不含任何公式,保證PM弄懂。

“把啤酒放在尿布旁,有助于提升啤酒銷售量”是關聯規則推薦的經典案例,今天,和大家聊聊“關聯規則推薦”,正文不含任何公式,保證PM弄懂。

一、概念

1. 什么是關聯規則(Association Rules)?

答:關聯規則是數據挖掘中的概念,通過分析數據,找到數據之間的關聯。電商中經常用來分析購買物品之間的相關性,例如,“購買尿布的用戶,有大概率購買啤酒”,這就是一個關聯規則。

畫外音:如果把買尿布記作A,買啤酒記作B。

“買尿布的用戶有較大概率買啤酒”這個關聯規則記作A -> B。

2. 什么是關聯規則推薦(Association Rule Based Recommendaion)?

答:顧名思義,利用關聯規則,來實施推薦。關聯規則推薦的目標,是希望達到

“將尿布放入購物車之后,再推薦啤酒”比“直接推薦啤酒”獲取有更好的售賣效果。

畫外音:這個目標非常非常重要,有些場景,或許直接推薦更有效。

關聯規則推薦的典型應用:

  • 線下,可以將尿布和啤酒放在一起
  • 線上,可以在用戶將尿布放入購物車后,立刻推薦啤酒

二、如何實施

假設某電商會售賣ABCD四種商品,歷史上共5筆訂單,分別賣出{A,B,C}, {B,C,D}, {A,B,C,D}, {A,C}, {C}。

1. 如何來實施“關聯規則”推薦呢?

第一步:數據準備

關聯規則

如上圖,縱坐標是所有歷史訂單,橫坐標是每筆訂單售出的商品。

第二步:計算關聯規則(組合商品)的支持度

2. 什么是支持度(support)?

答:共5筆訂單,3筆包含商品A,A的支持度是3/5。

很容易計算出,各個商品的支持度。從支持度可以看出,Best Seller是商品C,100%的訂單中都包含商品C,C的支持度是1。

除了單個商品,組合商品也有支持度。

關聯規則

共5筆訂單,2筆同時包含AB,即A->B的支持度是2/5。

畫外音:全局總共4種商品,假設關聯規則只關聯2種商品,則一共需要計算C(4,2)共6種組合商品的支持度{AB,AC,AD,BC,BD,CD}。

支持度評估商品包含在訂單中的“概率”,一個訂單,有多大概率包含這個商品。

畫外音:一般會先對支持度高的商品實施推薦,如果先實優化支持度低的商品,即使推薦效果翻倍,總體訂單提升效果也會很有限。

第三步:計算關聯規則的置信度

3. 什么是置信度(confidence)?

答:已知購買了A,有多大概率購買了B(即同時購買了AB),稱A -> B的置信度。

關聯規則

可以看到,商品A有3次購買,這3次中有2次購買了B,A->B的置信度是2/3。

畫外音:額,本來不想貼公式的

  1. confidence(A->B) = support(A->B)/support(A)= (2/5)/(3/5) = 2/3 

這也相對比較好理解,

  • 分子:support(A->B)是同時購買AB的比例
  • 分母:support(A)是只購買A的比例

二者相除,得到“購買了A,有多大概率購買B”,置信度的本質是條件概率。

這里需要注意的是,X->Y與Y->X的置信度不一定相等。

confidence(A->B) = support(A->B)/support(A)= (2/5)/(3/5) = 2/3

如上圖:

  • B->C的置信度是1,買商品B時,100%會買C,
  • C->B的置信度是3/5,買商品C時,只有3/5買了B。

畫外音:

  1. support(B->C)=3/5 
  2. support(C->B)=3/5 
  3. confidence(B->C)=support(B->C)/support(B)=1 
  4. confidence(C->B)=support(C->B)/support(C)=3/5 

公式是給程序看的,excel表格是給人看的,結果都一樣。

第四步:計算關聯規則的提升度

上一個例子里,confidence(B->C)=1,即:如果用戶購買商品B,100%會買C,那是不是意味著,如果用戶將商品B放入購物車,就可以向用戶推薦商品C呢?

答:不是。

我們來回顧一下,關聯規則推薦的目標,是希望達到

“將尿布放入購物車之后,再推薦啤酒”比“直接推薦啤酒”獲取有更好的售賣效果。

雖然購買商品B,100%會買C

畫外音:confidence(B->C)=1

但直接推薦C,用戶也100%會買C

畫外音:support(C)=1

會發現,購買B與購買C是獨立事件,用戶買不買C和用戶買不買B沒有直接關系。這里的關聯規則推薦,并沒有比直接推薦獲取更好的效果。

4. 用什么指標來評估關聯規則推薦的效果呢?

答:提升度。

5. 什么是提升度(lift)?

答:A->B關聯規則推薦,與直接推薦B,的比值,可以用來評估推薦效果:

  • 大于1,說明有效,在購買A時推薦B,比直接推薦B,效果更好
  • 等于1,說明無關,購買A與購買B,是獨立事件
  • 小于1,說明負相關,購買A時推薦B,效果還不如直接推薦B

畫外音:又有公式了

  1. lift(A->B) =confidence(A->B)/support(B) 

這也相對比較好理解,

  • 分子:confidence(A->B),購買A時,有多大概率同時購買B
  • 分母:support(B),有多大概率直接購買B

二者相除,得到效果是否更好。

還是通過兩個直觀的例子來看。

來看看關聯規則A->B,與直接推薦B,效果有沒有提升:

  • 有3個訂單購買A,這3個訂單中有2個訂單購買了B,所以A->B的置信度是2/3,即買了A有2/3的概率會買B
  • 直接推薦B的話,5個訂單中有3個購買了B,所以B的支持度是3/5,即有3/5的概率會直接買B

會發現,關聯規則推薦的效果更好。

畫外音:根據公式

  1. confidence(A->B) =support(A->B)/support(A) = 2/3 
  2. support(B) = 3/5 
  3. lift(A->B) =confidence(A->B)/support(B) = 10/9 
  4. lift(A->B) > 1 

故關聯規則推薦是正相關的。

來看看關聯規則A->D,與直接推薦D,效果有沒有提升:

  • 有3個訂單購買A,這3個訂單中有1個訂單購買了D,所以A->D的置信度是1/3,即買了A有1/3的概率會買D
  • 直接推薦D的話,5個訂單中有2個購買了B,所以D的支持度是2/5,即有2/5的概率會直接買D

會發現,關聯規則推薦的效果很差,還不如直接推薦。

畫外音:根據公式

  1. confidence(A->D) =support(A->D)/support(A) = 1/3 
  2. support(D) = 2/5 
  3. lift(A->D) = confidence(A->D)/support(D)= 5/6 
  4. lift(A->B) < 1 

故關聯規則推薦是負相關的。

三、總結

(1) 關聯規則A->B推薦,目標是,在“用戶將A放入購物車時,推薦B”比“單獨推薦B”獲取更好的效果

(2) A->B的支持度,是用戶同時購買A和B概率

(3) A->B的置信度,是用戶購買A的同時,有多大概率購買B

(4) A->B的提升度,是“用戶購買A的同時,有多大概率購買B”與“直接購買B的概率”的比值

  • 這個值大于1時,說明A->B有正向效果
  • 這個值等于1時,說明A和B是獨立事件
  • 這個值小于1時,說明A->B有負向效果

【本文為51CTO專欄作者“58沈劍”原創稿件,轉載請聯系原作者】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2021-03-12 09:45:00

Python關聯規則算法

2018-03-23 11:56:09

相似性推薦推薦算法推薦

2018-03-23 11:46:49

基于內容的推薦職位推薦集群

2021-03-31 09:10:25

UI設計經驗

2018-03-12 21:31:24

區塊鏈

2009-11-05 14:53:54

Visual Stud

2021-10-19 07:27:08

HTTP代理網絡

2020-10-13 18:22:58

DevOps工具開發

2021-04-30 16:23:58

WebRTC實時音頻

2023-09-07 23:52:50

Flink代碼

2022-12-16 09:55:50

網絡架構OSI

2019-11-22 11:10:26

區塊鏈技術

2018-01-19 09:45:20

架構師今日頭條算法

2017-07-06 08:12:02

索引查詢SQL

2018-03-12 14:37:50

區塊鏈比特幣架構

2024-06-25 12:25:12

LangChain路由鏈

2022-07-18 06:16:07

單點登錄系統

2009-11-09 12:55:43

WCF事務

2021-05-17 20:13:50

數倉操作型數據庫

2020-09-14 11:30:26

HTTP3運維互聯網
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩电影免费在线观看中文字幕 | 九九热最新视频 | 爱爱免费视频 | 国产免费福利小视频 | 中文字幕1区 | 天天天操操操 | 天天在线操 | 国产欧美一区二区三区国产幕精品 | 亚洲 一区 | 午夜精品久久久久久久久久久久 | 欧美日韩视频在线第一区 | www日日日 | 国产成人精品一区二区三区网站观看 | 伊人网伊人网 | 日韩美女一区二区三区在线观看 | 中文精品一区二区 | 九七午夜剧场福利写真 | 国产精品久久久久久久午夜 | www.国产一区 | 亚洲成人一区 | 欧美三级视频在线观看 | 成年男女免费视频网站 | 成人在线免费视频 | 天堂中文在线播放 | 国产超碰人人爽人人做人人爱 | 免费在线视频一区二区 | 国产一区二区三区 | 91啪影院| 韩日一区二区 | www.亚洲精品 | 久久国产成人 | 国产精品一区三区 | 久久性av | 91精品国产91久久久久久 | 91精品国产综合久久婷婷香蕉 | 日韩不卡一区二区三区 | 成人av免费 | 欧美九九| 欧美精品一区二区三区在线播放 | 精品在线一区二区 | 一级毛片视频 |