成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

推薦系統多場景預估建模2024大廠工作匯總

發布于 2024-12-4 12:03
瀏覽
0收藏

在大廠的推薦系統建模中,多場景建模是一個非常常見的業務場景。在很多app中,不同的場景都需要建模點擊率、轉化率等目標,以此進行排序給用戶展現最感興趣或最可能成交的候選。一種最簡單的建模方法是每個場景分別訓練一套模型,但是這種方式無法充分利用各個場景數據的共性信息,并且維護起來也非常麻煩。因此,如何有效聯合多場景數據進行建模,或者進行多場景之間的知識遷移,是工業界推薦系統近兩年研究的焦點。

今天這篇文章,給大家匯總了4篇2024年多場景建模的大廠頂會工作,詳細梳理阿里、美團、騰訊等大廠在頂會發表的多場景聯合建模工作。

1.高效的多場景建模方法—MLoRA

MLoRA是阿里發表于RecSys 2024的多場景建模工作MLoRA: Multi-Domain Low-Rank Adaptive Network for CTR Prediction,核心是提出了一種基于LoRA的多場景建模框架,實現低參數量、高效率的多場景聯合建模。下圖對比例如MLoRA相比其他方法的核心優化點,主要是在每個domain的特有tower上,使用了LoRA的分解結構,顯著減少了模型參數量。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

具體實現細節上,由于CTR預估模型的Dense層參數每層寬度是不一樣的,因此矩陣分解的維度如果像NLP模型設置成一樣的會導致各層信息壓縮比例不匹配的問題,因此文中針對每一層Dense根據其寬度設定個性化的壓縮比例。在訓練過程中,現在基礎數據上訓練多領域共享的參數,單后再在各個領域數據上finetune LoRA部分,并凍結住預訓練部分參數。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

2.冷啟場景優化—SwAN

SwAN是美團在RecSys 2024發表的工作Scene-wise Adaptive Network for Dynamic Cold-start Scenes Optimization in CTR Prediction,重點解決頻繁更新的多場景建模業務問題。在美團的場景中,經常會出現場景的切換,比如春天和冬天的推薦場景就不同,每次更新場景數據分布差異都很大,都需要重新訓練模型,這個過程中就面臨著嚴重的冷啟問題。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

為了解決上述問題,SwAN在數據輸入層面和模型結構層面都提出了優化。在數據輸入層面,核心思路是將冷啟的場景和其他已經有數據的場景關聯起來,一方面采用統計方法,將和冷啟場景商品基礎信息(如價格等屬性)最相似的其他場景作為可參考的對象。另一方面構建了Similarity Attention Network,將冷啟場景,上一步找到的其他相似場景的特征,以及user信息輸入到該網絡中,進行更細粒度的場景間關系學習,通過softmax生成一個冷啟場景到各個潛在相似場景的關聯打分,再加權融合成冷啟場景的底層表征。在模型結構層面,采用了類似MMoE的結構,通過上一步輸出的多場景相似性表征,選擇激活那些expert用于后續預測。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

3.對比學習提升user特征平衡性—UCLR

UCLR是阿里在WWW 2024發表的一篇工作Not All Embeddings are Created Equal: Towards Robust Cross-domain Recommendation via Contrastive Learning,重點解決多場景下user embedding的學習問題。本文提出的核心問題在于,不同場景下,不同用戶的交互次數差異很大,就導致每個場景每個用戶的數據分布很不平衡。那些在某個場景數據量較少的用戶,其embedding學習不充分,就導致預測效果不佳。

為了解決這個問題,文中首先借助所有場景數據預訓練一個全局的user embedding。接下來,為了讓這個user表征學習更充分,引入了一個重構任務,對user embedding進行30%的mask,替換成全0的向量,并基于autoencoder并進行還原,通過這個過程挖掘用戶之間的協同信號,利用豐富數據user的表征輔助數據稀疏user的表征。Encoder的中間編碼結果相當于是一個embedding的embedding。對于這個中間embedding,使用對比學習進行表示學習,并且根據user的交互數據量定義對比學習的溫度系數,讓數據量較少的user也能學習充分。Decoder生成的embedding用來還原原始embedding。通過上述的對比學習+autoencoder的優化方法,實現對user表征的進一步優化。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

4.User相似度對齊的遷移約束—CUT

CUT是騰訊在SIGIR 2024發表的工作Aiming at the Target: Filter Collaborative Information for Cross-Domain Recommendation中提出的建模方法。這篇文章的核心優化點在于,跨域的遷移不一定都是正向的。比如在一個domain中,2個user的興趣相似,可以進行信息的協同過濾,但是在另一個domain中這兩個user的興趣可能不同,直接遷移會帶來跨域負遷移的問題。

為了解決上述問題,本文提出基于user相似度進行跨域遷移的約束。具體來說,先用目標域數據訓練一個基礎模型,用這個基礎模型的user embedding計算兩兩user之間的相似度,并根據一個閾值劃定兩個用戶是否相似(1或者0),形成一個相似關系矩陣。這個矩陣衡量了在目標域兩個用戶之間是否相似。接下來,使用目標域和源域同時訓練最終模型,使用一個MLP網絡將源域的user表征進行一步映射,作為額外信息提供給目標域網絡。這個MLP表征映射網絡,基于前面的user相似關系矩陣進行約束,要求源域映射后的user embedding,仍然滿足經過目標域user embedding計算的user相似度,以此實現對負遷移問題的緩解。

推薦系統多場景預估建模2024大廠工作匯總-AI.x社區

本文轉載自??圓圓的算法筆記??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 91久久精品 | 日日爱av| 黄色免费在线网址 | 伊人色综合久久久天天蜜桃 | jav成人av免费播放 | 日本中文在线 | 国产精品久久久久久久久免费高清 | 亚洲另类春色偷拍在线观看 | 日韩第一页 | 可以在线观看av的网站 | 在线播放一区二区三区 | 欧美日韩在线免费观看 | 免费黄色大片 | 欧美高清一区 | 国产一级毛片精品完整视频版 | 久久99精品久久久久久 | 亚洲国产成人精品一区二区 | 精品久久久久久久久久久久久久久久久 | 成人在线视频一区 | 欧美一a一片一级一片 | 国产一区二区三区色淫影院 | 亚洲国产精品久久久 | 亚洲国产成人精品久久久国产成人一区 | 国产精品2区| 免费日本视频 | 国产一区二区三区亚洲 | 亚洲欧美一区二区三区国产精品 | 午夜小视频免费观看 | 欧美日韩高清一区 | 亚洲人人 | 亚洲国产一区二区三区 | 国产精品第2页 | 伊人一区 | 久久精品小视频 | 中文字幕高清 | 欧洲亚洲一区二区三区 | 日韩av在线一区二区 | 国产线视频精品免费观看视频 | 欧美精品一区在线观看 | 伊人狠狠干 | 99在线免费观看视频 |