成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

查電影評分上互聯網?別逗了!

原創 精選
開發
互聯網上存在著大量的電影評分網站,成為了許多觀影人觀看電影前的必備工具。然而區間評分法在這些網站上卻是不成立的評分系統……

作者 | 汪昊

審校 | 重樓

自互聯網誕生以來,互聯網上的評分網站層出不窮。美國的 IMDB 和爛番茄等網站都有大量的電影評分和影評。許多人在觀影之前都要上類似的網站搜索電影評分以決定自己是否要看某一部電影。可以說,在過去 10 年的人類文明發展過程中,無數的人已經養成了這一習慣。今天,我們要給大家潑一盆冷水:以后還是別上電影評分網站搜電影了。電影評分網站的評分根本就不可靠。

在說服大家之前,我們先來介紹一下什么是博爾達計數法。博爾達計數法是1770 年法國科學家提出的評選法國科學院院士的投票方法。雖然博爾達計數法的發明時間可能遠遠早于 1770 年,但是該方法還是以博爾達的名字命名了。博爾達計數法的投票方式如下:假設現在有 N 個候選人競選某個職位,觀眾給他們投票,每個人給心中的第一名打 N 分,給第二名 N-1 分…… 最后統計所有分數的總和,得分最高的候選人獲選。博爾達計數法被用在金球獎評分等活動中,時至今日仍然影響著我們。

或許我們對博爾達計數法沒有那么熟悉,但我們一定見過博爾達計數法的變種——區間評分法。所謂區間評分法,舉個例子,在 IMDB 上,我們看一部電影,最高分給 5 分,差一些的給 4 分,…… 這就是所謂的區間評分法。因為我們給的分數是一個區間內的整數,所以叫區間評分法。下面,我們將要告訴讀者,所有基于區間評分法的評分系統都是無效評分系統。

在國際學術會議 ICHESS 2023 上,研究者發表了一篇題為 The Fallacy of Borda Count Method -- Why it is Useless with Group Intelligence and Shouldn't be Used with Big Data including Banking Customer Services 的論文,否定了大數據場景下區間評分法的合理性。因為區間評分法廣泛應用于文化評分網站、電商商品和客服評價系統、銀行柜員評價系統、移動通訊客服評價系統等,因此這篇論文意義深遠,值得每一個人認真閱讀。

這篇論文首先回顧了作者在過去 3 年發表的若干篇論文。這些論文介紹了若干零樣本學習算法:ZeroMat、DotMat、RankMat、PoissonMat、PowerMat、LogitMat 等。這些論文有一個共同特點:在不借助遷移學習/元學習和預訓練模型的前提下,可以不利用任何用戶評分數據,極為準確的預測用戶物品評分值,是人工智能歷史上第一批真正意義的零樣本學習算法。這些算法,可以在推薦系統領域完美的解決冷啟動問題,并且效果絲毫不遜于有完整數據的非零樣本學習算法。這些顛覆性的成果迫使我們重新思考整個推薦系統領域和在線評分網站評分體系的有效性。這些算法都有一個共同特點,就是充分利用了推薦系統輸入數據的冪律特性,使用評分本身近似評分分布,來替代最大似然函數中的相關公式,從而達到不需要任何實際數據就能完成推薦的目的。

要想理解這些算法,就必須先理解矩陣分解算法。所謂矩陣分解算法,就是利用用戶特征向量和物品特征向量的點乘來最大程度的近似用戶物品評分。矩陣分解的損失函數如下:

損失函數 L 可以通過隨機梯度下降法進行求解。關于矩陣分解的最精確的數學解釋是 2007 年的推薦系統里程碑論文 Probabilistic Matrix Factorization。這篇論文將矩陣分解重構成了最大似然函數求解問題。ZeroMat 將評分的高斯分布假設改成了真實的冪律分布,得到了如下的最大似然函數求解公式:

這個公式可以利用隨機梯度下降進行求解。求解過程如下(標準差設定為 1):

這個算法在 MovieLens 和 LDOS-CoMoDa 數據集合上進行測試,都取得了和利用全部用戶評分數據進行運算的矩陣分解算法比肩的效果。

DotMat 算法的損失函數公式如下:

利用隨機梯度下降公式對該損失函數進行求解,得到如下公式:

為了省略文章篇幅,下面我們只討論 PoissonMat 和 LogitMat 這兩個算法。PoissonMat 算法的最大似然函數公式如下:

利用隨機梯度下降對最大似然函數進行求解,得到如下公式:

下面我們看一下 LogitMat 算法。這個算法的損失函數結合了邏輯回歸和矩陣分解:

利用隨機梯度下降對損失函數進行求解,得到了如下公式:

通過觀察這些函數的求解公式,我們發現這些算法無一例外的都不需要任何用戶評分數據。我們可以在不借助任何數據的情況下完成推薦算法的設計。下面我們從這些算法的原始論文中找出一些原始圖片來分析一下算法的結果:

圖 1 和圖 2 展示的是 ZeroMat、DotMat、PoissonMat 和 LogitMat 與經典的矩陣分解模型的對比結果。可以看到,許多不需要任何數據的算法在準確性和公平性指標上都擊敗了經典的矩陣分解模型,而該模型利用了所有的用戶評分矩陣數據。

這一系列的結果讓我們有了充足的理由推翻區間評分法:因為冪律效應的原因,我們可以使用評分本身代替評分的概率分布對最大似然函數進行建模,這樣可以得到零樣本學習算法,并且零樣本學習算法可以精確預測用戶評分喜好,在 [1, 5] 評分區間上評分誤差可以不超過 0.8 。這一發現在很大程度上沖擊了我們對于推薦系統領域的認知。因為用戶評分數據,特別是電影評分數據中的冪律效應不可避免,所以零樣本算法永遠成立。既然一個人給電影打多少分可以不用任何數據進行預測,這樣的評分系統還有何用?因此電影評分網站的評分系統都是無效的評分系統。而這一結論可以輕易的擴展到其他區間評分的系統中去:只要該系統的輸入存在冪律效應,區間評分法就是無效的。

查電影評分上互聯網?別逗了!你給電影打多少分,不用查你的歷史數據就能猜的很準。而這僅僅是因為電影評分的冪律效應。這樣的影評評分系統,你敢用嗎?

作者簡介

汪昊,前 Funplus 人工智能實驗室負責人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司擔任技術和技術高管職務。在互聯網公司和金融科技、游戲等公司任職 12 年,對于人工智能、計算機圖形學和區塊鏈等領域有著深刻的見解和豐富的經驗。在國際學術會議和期刊發表論文 42 篇,獲得IEEE SMI 2008 最佳論文獎、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 最佳論文報告獎。

責任編輯:華軒 來源: 51CTO
相關推薦

2015-06-24 15:35:54

2020-07-30 07:47:32

互聯網

2014-12-26 09:52:52

2020-10-09 09:28:43

互聯網數據技術

2014-01-15 14:35:35

云計算

2015-05-28 16:11:07

互聯網+

2013-11-21 13:45:35

產品經理產品

2018-12-05 10:07:06

互聯網

2015-10-08 15:20:34

互聯網物聯網

2015-09-22 09:17:33

互聯網發展史

2015-10-30 17:50:18

互聯網金融

2018-08-15 09:02:59

產業互聯網工業互聯網物聯網

2012-04-01 10:54:20

2012-08-16 09:15:29

2018-12-24 15:50:29

Windows 10互聯網應用程序

2015-03-25 18:31:20

互聯網+

2017-08-03 16:37:35

互聯網法院司法

2011-12-19 16:45:22

2016-12-05 13:22:15

互聯網移動互聯網物聯網

2017-09-27 16:04:08

AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品一区二区三区中文在线 | 国产一区电影 | 91资源在线 | 不卡一区二区三区四区 | 亚洲精品国产第一综合99久久 | 精品一区二区三区在线观看 | 午夜视频在线播放 | 久久精品久久久 | a级黄色毛片免费播放视频 国产精品视频在线观看 | 日韩精品激情 | 亚洲一区二区三区在线播放 | 免费视频二区 | 欧美一级毛片免费观看 | www.47久久青青 | 麻豆av在线免费观看 | 狠狠狠干| 国产欧美日韩久久久 | 精品国产免费一区二区三区五区 | 久久免费精品 | 成人国产精品入口免费视频 | 日本亚洲精品成人欧美一区 | 国产精品久久久久久久免费大片 | 超碰人人人| 国产精品久久久久久 | 国产精品电影在线观看 | 久久草视频 | 亚洲国产精品一区二区第一页 | 成人av影院 | 一区二区在线观看免费视频 | 欧美黄色绿像 | 国产精品99久久久久 | 天天躁日日躁狠狠的躁天龙影院 | 欧美国产日韩一区二区三区 | 久久国 | 日韩快播电影网 | 一级片免费在线观看 | 久久曰视频 | 亚洲一区免费 | 97色在线视频 | 国产成人精品a视频一区www | 日韩精品一区二区三区中文在线 |