成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tbody id="mekci"><dfn id="mekci"></dfn></tbody>

<em id="mekci"><s id="mekci"></s></em>

<dl id="mekci"><center id="mekci"></center></dl>

<object id="mekci"></object>

<center id="mekci"><sup id="mekci"></sup></center>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果

發布于 2025-6-25 07:49

瀏覽

0收藏

今天給大家介紹一篇中科大、騰訊聯合發表的CTR預估模型優化工作，探索了多專家網絡多樣性對于模型效果的影響。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

論文標題：Enhancing CTR Prediction with De-correlated Expert Networks

下載地址：??https://arxiv.org/pdf/2505.17925??

1.研究背景

最近兩年，隨著Scaling Law在各個領域的研究，推薦系統領域也開始逐漸引入這種思想進一步提升模型能力。其中，一種常見的思路是利用MoE擴大參數空間，并結合多種類型的網絡結構構建預估模型。

如何才能構建出效果最優的MoE預估模型呢？文中研究發現，各個Expert之間的差異性大小，決定了最終效果的高低。文中定義了不同Expert的不相關度指標，對比了不同不相關度下，模型AUC變化。從圖中可以看出，隨著各個Expert不相關度的增加，模型的效果是逐漸提升的。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

基于上述考慮，文中通過模型結構差異性、正則化loss引入、embedding差異等多個角度，降低各個Expert的相關性，從而提升基于MoE的CTR預估模型的效果。

2.建模方法

下圖整體對比了不同MoE的結構圖。其中Hetero-MoE是本文的建模方法，其核心是每個Expert有一套單獨的Embedding，并且每個Expert使用不同的網絡結構，從而最大限度提升不同Expert之間的差異性和抽取信息的多樣性。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

在具體提升差異性的手段上，文中從底層Embedding、網絡結構、正則化損失三個角度進行優化。

對于底層Embedding，文中采用了每個Expert使用一套單獨的Embedding的方法，讓各個Expert在學習過程中實現Embedding的差異性。

對于模型結構，相比一般的MoE各個Expert采用結構，本文采用了不同結構，每個Expert可以是CrossNet、CIN、基礎DNN等不同結構。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

對于正則化約束，文中首先定義了各個Expert之間的相關性指標。這里采用的是皮爾遜系數，計算每個Expert多條樣本的之間的相關系數，直接作為損失函數引入模型中，公式如下：

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

在MoE的Gate生成方面，基本沿用了經典MoE的思路，差異在于每個Expert使用對應Embedding生成一個個性化的Gate打分。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

3.實驗效果

從實驗結果來看，不同的增加各個Expert之間差異行的方法，包括Embedding差異、模型結構異構、正則化損失引入等，都能帶來模型AUC的提升，說明增強各個Expert之間差異的必要性。

中科大&騰訊：通過提升各個專家網絡差異性提升基于MoE的CTR預估效果-AI.x社區

本文轉載自??????圓圓的算法筆記??????，作者：Fareise

標簽

贊

收藏

回復

舉報

回復

相關推薦

檢索感知微調（RAFT），提升領域RAG效果的新方法

Syrupup ? 4680瀏覽 ? 0回復
中科大等意外發現：大模型不看圖也能正確回答視覺問題！

Crystalcxt ? 2496瀏覽 ? 0回復
LLM落地淘寶電商搜索場景，顯著提升長尾query改寫效果

海因斯DK ? 6812瀏覽 ? 0回復
百萬級高質量視頻數據集發布，登頂抱抱臉數據集排行榜，中科大&上海AI Lab等出品

Crystalcxt ? 3066瀏覽 ? 0回復
中科大聯合華為諾亞提出Entropy Law，揭秘大模型性能、數據壓縮率以及訓練損失關系

輕薄滴假象 ? 2903瀏覽 ? 0回復
中科大提出UniMEL框架 | 革新知識圖譜，引領多模態實體鏈接新紀元

AI論文解讀 ? 4658瀏覽 ? 0回復
動手實現GraphRAG，檢索效果大幅提升

小虎哦哦 ? 3794瀏覽 ? 0回復
中科大、上海AI Lab發表的MindSearch思·索: 模擬模仿人類思維引發的深度AI探索者

sbf_2000 ? 2817瀏覽 ? 0回復
中科大&微信等提出多模態大語言模型EE-MLLM

angel ? 2654瀏覽 ? 0回復
一文總結特征增強&個性化在CTR預估中的經典方法和效果對比

海因斯DK ? 2537瀏覽 ? 0回復
中科大&科大訊飛重磅開源OpenMusic：音樂生成更高質量，更有樂感

angel ? 3839瀏覽 ? 0回復
大模型面經——MoE混合專家模型總結

shizhi02 ? 3104瀏覽 ? 0回復
中科大重磅開源StableV2V：專注于「人機交互一致性」的視頻編輯方法

angel ? 2981瀏覽 ? 0回復
中科大揭秘微調大模型的秘訣：如何精準選擇數據提升AI性能

AI論文解讀 ? 3202瀏覽 ? 0回復
漫畫混合專家（MoE）

sulu637 ? 1939瀏覽 ? 0回復
掰細了講混合專家模型MoE的內部結構

智駐未來 ? 3316瀏覽 ? 0回復
2024‘Meta 推出CTR集成框架 CETNet，多 CTR 模型集成大幅提升預測精度

AIPaperDaily ? 2220瀏覽 ? 0回復
WebWalker：通過Multi Agent提升RAG在開放域QA的性能

大語言模型論文跟蹤 ? 2096瀏覽 ? 0回復
奇奇怪怪的研究：RAG 如何提升 ASR 效果的研究

芝士AI吃魚 ? 2569瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

ICML'25 | 兼容不同數據源周期性差異的時間序列基礎模型 8天前發布
KDD'25｜適用于時間序列的頻域數據增強方法，顯著提升表示學習效果 2025-06-12 06:54:27發布

熱門推薦

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統OneRec！ 0回復

上一篇： KDD'25｜適用于時間序列的頻域數據增強方法，顯著提升表示學習效果

下一篇： ICML'25 | 兼容不同數據源周期性差異的時間序列基礎模型

社區精華內容

目錄

主站蜘蛛池模板：日韩www | 99福利视频 | 成人h视频| 国产精品自产av一区二区三区 | 黄网站免费观看 | 成人免费精品 | 成人精品一区二区三区 | 免费v片| 天天综合网永久 | 亚洲不卡在线观看 | 午夜极品 | 久久久成人免费一区二区 | 永久www成人看片 | 亚洲性免费 | 99久热| 99精品视频一区二区三区 | 亚洲美乳中文字幕 | 日韩欧美一级精品久久 | 欧美综合国产精品久久丁香 | 色综合久久久 | 亚洲激情视频在线 | 亚洲中午字幕 | 黑人巨大精品 | 区一区二区三在线观看 | 久久99精品久久久久久噜噜 | 黄色片免费看视频 | 中文字幕在线第二页 | 国产一区在线视频 | 午夜电影合集 | 国产精品亚洲第一区在线暖暖韩国 | 国产激情亚洲 | 亚洲精品一 | 欧美成人h版在线观看 | 91精品国产91久久久久久吃药 | 亚洲乱码一区二区三区在线观看 | 欧美性高潮| 99国内精品久久久久久久 | 中文字幕在线二区 | 久久99成人 | 成人久久久 | 91干b|

<bdo id="sagwg"></bdo>

<abbr id="sagwg"></abbr>

<samp id="sagwg"><button id="sagwg"></button></samp>