?作者 | 汪昊
審校 | 孫淑娟
推薦系統公平性是 2017 年以來爆火的人工智能研究領域。知名的人工智能公司比如 Twitter, Google, IBM和百度,都創立了人工智能倫理團隊或研發了人工智能倫理產品。然而讓人遺憾的是,人工智能倫理研究在國內起步較晚,跟國外相比,目前仍然存在著一定差距。
排序學習是在 2010 年左右爆發的機器學習技術,在推薦系統和信息檢索領域都得到了廣泛的應用。在最近幾年,排序學習成為了熱門的人工智能倫理研究算法基準。
本文將要介紹的是 2022 年在國際學術會議 CISAT 2022 (International Conference on Computer Information Science and Application Technology) 發表的論文 Pareto Pairwise Ranking for Fairness Enhancement of Recommender Systems。本文主要講解了如何結合帕累托分布和排序學習實現公平的排序學習推薦算法。
圖1. MovieLens 數據集觀影評分差概率分布
我們根據觀察(圖1)和統計學理論(齊夫分布的統計估計)可以得到如下結論: 同一個用戶對不同物品的評分差的概率分布正比于評分差。我們修改概率矩陣分解的損失函數,得到我們發明的新算法帕累托排序學習(Pareto Pairwise Ranking)的損失函數公式:
把我們剛才的觀察帶入到損失函數公式中,我們得到如下損失函數公式:
我們把 L 取對數,得到如下公式:
我們利用隨機梯度下降公式求解損失函數對數,得到如下公式:
帕累托排序學習的算法流程如下:
圖2和圖3顯示的是帕累托排序學習在 MovieLens 1 Million Dataset 數據集上的測試結果。論文作者對比了 10 種推薦系統算法,發現帕累托排序學習算法在公平性指標上表現最好。
圖 4 和圖 5 顯示的是帕累托排序學習在 LDOS-CoMoDa 數據集上的測試結果。帕累托排序學習算法在公平性指標上的表現依然最好。
帕累托排序學習算法是國內少見的基于公平性的排序學習推薦系統算法。算法原理簡單,實現簡便,運行速度快。作者在 16G RAM 和 Intel Core i5 的聯想筆記本上測試,執行速度飛快。人工智能倫理研究在國際上目前是研究熱點,希望引起大家的足夠重視。
作者簡介
汪昊,前 Funplus 人工智能實驗室負責人,在 ThoughtWorks, 豆瓣,新浪,網易等公司有超過 11 年的研發和管理經驗。在推薦系統、聊天機器人、風控反欺詐領域有豐富的技術經驗。在國際學術會議和期刊上發表論文 30 篇,獲得最佳論文獎/最佳論文報告獎3次。2006 年 ACM 區域賽金牌。本科和碩士畢業于美國猶他大學。對外經貿大學在職 MBA。