成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Graphical model在收藏夾作弊行為識別上的應(yīng)用

原創(chuàng)
人工智能
本文將從作弊行為分析,構(gòu)建模型,求解模型三個部分對這個工作進行詳細介紹。目前文章已被WWW 2018接收(接收率14.8%)。

 總述

Graphical Model通常應(yīng)用在問題本身帶有多個相互聯(lián)系的變量的場景,并提供了一種基于圖的表達方式讓你去建模這些聯(lián)系從而挖掘潛在的因果關(guān)系。在本文中,我們創(chuàng)新性地將概率圖模型應(yīng)用到了淘寶平臺收藏作弊行為檢測的任務(wù)中,取得了遠超傳統(tǒng)分類模型的結(jié)果(Top1%記錄中召回60%的作弊行為)。

本文我們將從作弊行為分析,構(gòu)建模型,求解模型三個部分對這個工作進行詳細介紹。目前文章已被WWW 2018接收(接收率14.8%)。

背景介紹

隨著在線購物網(wǎng)站的發(fā)展,在線購物正在逐步取代傳統(tǒng)的購物方式。2016年普華永道的調(diào)查顯示54%的購物者每周或每月都會在網(wǎng)上購買商品,其中34%的購物者認為手機是他們主要的購物工具。在購物網(wǎng)站中,搜索引擎是用戶找到具體商品,款式或者品牌的主要入口。

在搜索引擎的幫助下,用戶能夠方便地在購物網(wǎng)站上完成一系列加購,收藏,購買行為,而這些用戶行為數(shù)據(jù)本身也蘊含著極大的價值,在優(yōu)化購物網(wǎng)站的推薦和搜索中扮演了非常重要的角色。“加入收藏夾”作為淘寶一個重要的功能,可以方便用戶收藏一些暫時不買的商品。與此同時,商品被“加入收藏夾”的數(shù)量,也稱作人氣,也是淘寶的搜索引擎提供的一種可選的排序策略;且對于默認的綜合排序,人氣值也常常作為一個參數(shù)被引入進去。

為了提升產(chǎn)品或店鋪的排名及可見度,部分惡意商家采取虛假的作弊行為以提高銷量,主要包括虛假推廣行為(收藏、加購和轉(zhuǎn)發(fā))及虛假的評論行為。目前,針對于淘寶作弊活動的地下產(chǎn)業(yè)已趨近成熟,尤其是隨著眾包平臺的發(fā)展,這些商家可以根據(jù)自己的需求,便捷地發(fā)布作弊任務(wù),吸引眾多的參與者來完成作弊活動,從而快速高效的實現(xiàn)產(chǎn)品或店鋪的宣傳推廣。

以虛假收藏為例,惡意商家通過發(fā)布任務(wù),快速提高其商品的人氣值,從而影響淘寶的推薦和搜索排序策略,進一步提高商品銷量。這類借助眾包平臺的作弊行為能夠在短時間內(nèi)產(chǎn)生大量異常數(shù)據(jù),且難以檢測,會對用戶以及購物網(wǎng)站本身造成惡劣的影響。因此,如何快速有效地找到這些作弊活動,對于淘寶來說非常重要。

作弊活動運作模式

通過調(diào)研灰產(chǎn)平臺提供的收藏作弊服務(wù),我們總結(jié)了如下圖所示的作弊模式:

 

首先商家通過平臺發(fā)布作弊任務(wù),指定商品,搜索關(guān)鍵詞,任務(wù)時間以及傭金。除了這些基本的信息之外,商家還會提出一些特殊的要求,例如在搜索結(jié)果頁中瀏覽超過x分鐘,在搜索結(jié)果中隨機點擊y個商品,再點擊指定商品進行收藏,有一些任務(wù)還需參與者滿足一定的等級要求。平臺的用戶看到任務(wù)之后會去申領(lǐng),根據(jù)任務(wù)中提出的要求進行搜索,瀏覽,點擊,收藏等一系列動作,***還需要截圖,以便去平臺申領(lǐng)傭金。

此類平臺的用戶,多為兼職刷手,作弊行為只是其在淘寶平臺留下的行為的一部分。此外,收藏作為一個隱私行為,無法被大眾察覺,缺少類似于“對我有用”、“***答案”等顯性的指標。因此,這類新興的作弊任務(wù),很難用已有的方法進行檢測。

為了針對此類作弊行為進行識別,我們收集了作弊平臺上一個月時間的任務(wù),用于對用戶行為進行標注。同時,我們分別從用戶屬性,商品屬性以及行為屬性三個角度,對收藏作弊進行了深入分析。我們將這些屬性和用戶,商品之間的關(guān)聯(lián)關(guān)系用Factor Graph模型進行了整合,并基于此設(shè)計了一個分類模型來檢測可能的收藏作弊行為。

用戶、商品以及行為屬性對比分析

行為屬性分析

首先,我們對作弊收藏行為和正常收藏行為之間的屬性差異做了詳盡的對比。

從加購角度看,作弊收藏行為中帶有加購動作的只有6%,而在正常收藏行為中則有8%。這個差異主要是因為極少數(shù)的收藏作弊任務(wù)中會有加購物車的要求,另外作弊收藏的商品本身也不是用戶想要的,自然加購的意愿也就差一些。在搜索過程中,用戶可以通過一些篩選條件(發(fā)貨地,價格區(qū)間等)來更有效的找到商品,這里作弊收藏對比正常收藏,使用篩選的比例反而更低一些。

對于收藏前是否有其余的商品點擊(在當前這次搜索過程中),作弊收藏行為明顯高出正常收藏行為很多。這個主要還是因為作弊任務(wù)中很多都要求多點幾個商品。從時間上看,作弊行為更傾向于發(fā)生在周末,這可能是與作弊用戶是兼職的有關(guān)系。

在下圖中,我們對更多的行為屬性進行了對比,這其中包括了搜索關(guān)鍵詞的長度,搜索結(jié)果頁瀏覽深度,搜索結(jié)果頁停留時間以及點擊商品詳情頁的停留時間。

通過上面的分析,我們可以看到除了前序商品點擊之外,其余的多種屬性上,作弊收藏行為和正常收藏行為之間的差異性并不大,這也進一步印證了但從行為本身來區(qū)分作弊與非作弊是非常困難的。

用戶屬性分析

在接下去的分析中,我們將收集到的作弊樣本涉及的用戶定義為作弊用戶,其余的用戶稱為正常用戶,類似作弊樣本中的商品成為作弊商品,其余的商品成為正常商品。

從上表中可以看到,作弊用戶的行為(收藏,加購,購買,評論)明顯要少于正常用戶。這些行為能反映出一個用戶在平臺上投入的時間,很顯然,作弊用戶的活躍度遠低于正常用戶。

我們?nèi)×似渲幸粋€作弊用戶,來觀察其收藏行為的持續(xù)性。結(jié)果如上圖中展現(xiàn),作弊用戶會在一段持續(xù)的時間里(前半個月)收藏一定數(shù)量的作弊商品。這個數(shù)據(jù)說明,作弊用戶收藏作弊商品會在某個持續(xù)的時間窗口內(nèi)。

商品屬性分析

與用戶屬性分析類似,我們也對比了作弊商品和正常商品之間的差異性。數(shù)據(jù)見下表。很明顯,作弊商品上的行為數(shù)據(jù)遠低于正常商品,這也反映出,通常只有表現(xiàn)不是很好的商品會尋求作弊,同時這些作弊商品也很難吸引到正常的用戶。

我們選取了一個作弊商品和一個正常商品,觀察它們被收藏的持續(xù)性,結(jié)果見下圖??梢钥吹剑鞅咨唐飞系淖鞅仔袨榧性谝粋€很短的時間窗口內(nèi),這或許是對應(yīng)的任務(wù)指定的時間。

作弊收藏檢測

模型定義

根據(jù)對作弊活動的分析,我們提取了有區(qū)分能力的特征,并將提取的特征因素和關(guān)聯(lián)因素統(tǒng)一整合到概率圖模型框架中(Activity Factor Graph Model, AFGM),進行虛假收藏活動的識別。

在AFGM模型中,我們一共引入了三方面的特征因素,包括行為特征,用戶特征和商品特征,同時引入了基于用戶和商品的關(guān)聯(lián)因素,即對于一個固定的時間窗口內(nèi),相同用戶或者相同商品產(chǎn)生的兩條收藏記錄建立邊的關(guān)系,具體模型如下圖所示。

 

 

模型求解

 

實驗結(jié)果

可以看到,傳統(tǒng)方法在作弊檢測這個問題上基本上沒有效果,而利用概率圖模型則均可得到一個較好的結(jié)果。相比之下,我們發(fā)現(xiàn)即便不考慮商品屬性因子和用戶屬性因子,模型已經(jīng)能到得到一個很好的結(jié)果了,加入這些因子之后只是對最終結(jié)果小幅提升。

上圖顯示了不同的概率圖模型在topk%下的檢測效率,可以看到在top10%中,我們就可以檢測出近80%的作弊行為,而AFGM與AFGM-UP兩種模型的表現(xiàn)非常接近。這個可能是由于相關(guān)性因子已經(jīng)包含了足夠的信息用于檢測作弊行為。AFGM-CP的表現(xiàn)是四種模型中最差的,這說明商品相關(guān)性因子在檢測作弊的時候更加重要。

小結(jié)

在本文中,我們對淘寶評上的收藏作弊行為從多個角度做了深入的分析,揭示了作弊行為與正常行為之間的差異性。通過這些分析,我們提取了多種特征,并提出了AFGM來推斷一次收藏行為是否為作弊。實驗結(jié)果顯示,AFGM在top1%的記錄中能召回超過60%的作弊行為。

通過不同模型之間的對比,我們也發(fā)現(xiàn)商品相關(guān)性因子在檢測作弊行為時更為重要。盡管我們提出的檢測模型具有相當高的效率,但是也得指出目前的算法只能對一個時間周期內(nèi)的作弊進行整體識別,尚不能對行為進行實時判別,這將是未來的一個研究方向。

作者:蘇寧、劉奕群、李朝、劉玉利

因涉及公式過多,免紕漏,附PDF,請點擊查看!

責任編輯:王雪燕 來源: 51CTO
相關(guān)推薦

2009-11-12 09:30:40

Google DocsChrome藏夾

2015-12-11 10:58:03

bing搜索移動

2009-05-21 14:22:24

瀏覽器共享收藏夾

2011-08-04 10:44:54

注冊表編輯器IE收藏夾

2009-08-24 08:59:10

IT白領(lǐng)網(wǎng)絡(luò)應(yīng)用

2012-10-16 20:21:30

搜狗地圖

2023-02-16 08:05:17

蘋果macOS

2011-08-17 10:52:01

windows7資源管理器收藏夾

2010-06-03 15:16:14

2011-12-23 11:25:50

win7

2021-01-31 12:11:21

微軟Edge瀏覽器

2021-02-19 07:57:00

JS 技巧路線

2021-01-26 05:04:47

屬性FlexBox用法

2023-06-21 15:37:07

微軟Edge瀏覽器

2024-12-23 08:53:20

微軟Edge瀏覽器

2023-09-18 06:55:13

Edge瀏覽器

2011-12-08 14:40:19

QQ通訊錄云備份

2023-05-15 17:04:33

Edge瀏覽器

2023-02-16 08:35:54

蘋果macOS

2011-09-01 10:10:56

OceanBase海量淘寶
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久久蜜臀国产一区二区 | 国产精品69毛片高清亚洲 | 亚洲一区二区 | 91精品国产综合久久久密闭 | 国产91久久久久久久免费 | 国产精品一区二区三区在线播放 | 免费午夜视频在线观看 | 午夜小电影 | 久久99精品视频 | 国产人成精品一区二区三 | 亚洲一区二区三区免费在线观看 | 特级一级黄色片 | 国产视频中文字幕 | 久久免费精品 | 毛片韩国| 色综合av | 日韩在线中文字幕 | 久久久青草 | 99在线精品视频 | 在线一区 | 成人免费在线视频 | 伊人狠狠干| 污片在线观看 | 欧美日韩a| 91精品一区二区三区久久久久 | 精品国产免费人成在线观看 | 日韩av一区二区在线 | 成人av网站在线观看 | 久久久精品网站 | 久久久久久a | 亚洲激情在线视频 | 国产一区二区精品在线 | 国产精品久久久久久久免费大片 | 亚洲欧美高清 | 超碰97av| 欧美成人激情视频 | 欧美一区二区三区在线 | 免费高清av| 成人欧美一区二区三区在线观看 | 4h影视| 国产成人自拍av |