成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

阿里SIGIR 2017論文:GAN在信息檢索領域的應用

開發 開發工具
信息檢索領域的頂級會議 SIGIR 2017 即將開幕。本文介紹了另一篇由英國倫敦大學、上海交大、阿里等合著的論文。

信息檢索領域的***會議 SIGIR 2017 即將開幕。昨日,機器之心報道了阿里被 SIGIR 2017 接收的一篇論文,據了解阿里共有 3 篇論文被此大會接收。本文介紹了另一篇由英國倫敦大學、上海交大、阿里等合著的論文。

論文鏈接:https://arxiv.org/pdf/1705.10513.pdf

Information Retrieval(IR)的典型問題是給出一些查詢詞(query),返回一個排序的文檔列表(documents),但 IR 的應用范圍可以擴展到文檔檢索、網頁搜索、推薦系統、QA 問答系統和個性化廣告等等。在 IR 的理論或模型領域,有兩種典型的思維方式(如圖所示):

在 IR 的理論或模型領域,有兩種典型的思維方式

 

  1. 生成式 IR 模型:***種思想認為 documents 和 query 之間有一個隱含的隨機生成(generative)過程,可以表示成:q→d,其中 q 表示 query,d 表示 document,箭頭表示生成的方向,生成模型對 p(d|q) 進行建模。
  2. 判別式 IR 模型:第二種思想采用了機器學習的方法,將 IR 的問題轉化成一個判別(discriminative)問題;可以表示成:q+d →r,其中+表示 query 和 document 的特征的組合,r 表示相關性,如果 r 為 0 或 1,則問題是一個分類問題,如果 r 是一個相關分數,則問題是一個回歸問題;現在著名的方法就是排序學習(Learning to Rank)。排序學習可以分為 Pointwise、Pairwise 和 Listwise 三種模型。

雖然 IR 的生成模型在 Query 和 Document 的特征建模(例如文本統計)的方面非常成功,但它在利用來自其他的相關性信息(如鏈接,點擊等等)方面遇到了很大的困難,而這些信息主要可以在現在互聯網的應用中觀察得到。于此同時,雖然諸如排序學習的 IR 判別模型能夠從大量的標記和未標記的數據中隱式地學習檢索排序函數,但是它目前缺乏從大量未標記數據中獲取有用特征或收集有用信號的原則性方法,特別是從文本統計(源自 Document 和 Query 兩方面)或從集合內相關文檔的分布中。

應用 GAN 的思想,IRGAN 引入博弈論中的 minmax 博弈,來將生成式 IR 模型和判別式 IR 模型進行結合。具體來說,我們為兩個模型定義一個共同的檢索函數(例如基于判別的目標函數)。一方面,判別模型旨在通過從標記數據中學習來***化目標函數,并為生成模型提供訓練的指導性信息。另一方面,生成模型充當挑戰者,不斷地將判別器的 decision boundary 推向其極限它為判別器迭代地提供最困難的情況,判別器通過對抗的最小化目標函數來重新訓練自身。

下面具體地介紹 IRGAN 的方法,會分別介紹 GAN 中對應的 Discriminator(D)和 Generator(G)。

1. Discriminator:,其中,φ 是 D 的參數。D 的輸入時 Query-Document 對數據(q,d),而輸出則是這對數據是否匹配。這相當于一個二分類問題,可以通過 logistic regression 給出:

與原始的 GAN 相同,D 的,目標是***化:

2. Generator:,其中,θ 是 G 的參數。G 的輸入時 Query,輸出是與 Query 相關的 documents 的概率分布,相關性即由這個概率分布表示。由 Softmax 函數給出:

G 的目標是最小化:

對 IRGAN 的 training 部分,G 和 D 交叉進行更新。對于 D,可以采用梯度下降更新法;對于 G,由于 G 的輸出是離散 documents 的概率分布,沒辦法直接采用梯度下降的方法求 G 的梯度,針對這種使用 GAN 訓練離散數據的問題,可以采用強化學習中 Policy Gradient 的方法,reward 由 D 給出。整個訓練過程如下圖算法所示:

在實驗部分,做了三個不同的 IR 任務:Web Search,Item Recommendation 和 Question Answering,實驗結果表明,IRGAN 模型打敗了多種 strong baseline。開源代碼在:https://github.com/geek-ai/irgan。

【本文是51CTO專欄機構“機器之心”的原創文章,微信公眾號“機器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2017-08-21 16:08:18

阿里論文

2018-07-05 15:57:10

2023-11-28 12:39:40

支付對賬領域

2020-12-25 13:51:49

大數據醫療大數據

2017-05-15 22:45:43

神經網絡架構信息檢索

2025-06-30 08:48:00

2018-06-14 16:15:10

2022-01-25 14:06:24

比特幣區塊鏈安全

2021-01-21 11:36:01

區塊鏈醫療安全

2011-07-22 13:44:15

2023-12-07 19:19:11

2021-04-19 16:49:58

區塊鏈傳媒技術

2010-06-03 12:04:18

Mesh網狀網技術Strix

2023-07-19 14:06:25

2021-03-03 10:11:16

區塊鏈商業工業

2019-11-12 15:45:07

區塊鏈數字貨幣智慧城市

2017-11-13 13:12:21

互聯網

2015-05-25 16:12:28

大數據公安領域應用

2013-08-07 10:34:56

Active Powe飛輪UPS

2020-07-30 15:14:16

AI阿里SIGIR 2020
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩欧美一区二区在线播放 | 色婷婷综合久久久中字幕精品久久 | jizz18国产 | 欧美日韩亚洲视频 | 欧美亚洲视频在线观看 | 在线精品一区二区 | 999精品视频 | 欧美一区二区三区在线观看 | 国产精品91久久久久久 | 羞羞的视频在线看 | 久草在线在线精品观看 | 国产精品一区二区久久久久 | 涩爱av一区二区三区 | 中文字幕av在线 | 亚洲国产视频一区二区 | 亚洲视频免费在线 | 黄色骚片 | 亚洲激情一区二区三区 | 啪啪综合网 | 国产在线观看一区二区三区 | 成人免费观看网站 | 久久精品亚洲精品国产欧美kt∨ | 天天久久 | 国产在线视频一区二区董小宛性色 | 亚洲最大成人综合 | 欧美精品一区二区三区在线播放 | 国产精品久久久久久久久久妞妞 | 日韩欧美一区二区三区 | 国产成人精品免费视频大全最热 | 成人免费影院 | 免费一区 | 日韩成人国产 | 欧美精品一区二区三区四区 在线 | 成人一区二区三区在线观看 | 婷婷色国产偷v国产偷v小说 | 久久久久成人精品 | 91国产精品 | 欧美成人一级 | 电影91久久久 | 伊人欧美视频 | 成人视屏在线观看 |