成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<label id="ufhzk"></label>

<blockquote id="ufhzk"><ruby id="ufhzk"></ruby></blockquote>

<address id="ufhzk"></address>

<address id="ufhzk"><ruby id="ufhzk"></ruby></address>

<cite id="ufhzk"><fieldset id="ufhzk"><acronym id="ufhzk"></acronym></fieldset></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

作者：佚名 2021-12-17 10:09:47

新聞人工智能

DeepMind通過教自動編碼器學(xué)會“自我糾正”，提出了一個叫做“圣代”（SUNDAE）的非自回歸模型。

本文經(jīng)AI新媒體量子位（公眾號ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請聯(lián)系出處。

一直以來，自回歸語言模型（Autoregressive model，AR）在文本生成任務(wù)中表現(xiàn)都相當(dāng)出色。

現(xiàn)在，DeepMind通過教自動編碼器學(xué)會“自我糾正”，提出了一個叫做“圣代”（SUNDAE）的非自回歸模型。

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

它不僅能在WMT’14英德互譯任務(wù)中取得非自回歸模型中的SOTA，還表現(xiàn)出與自回歸模型相當(dāng)?shù)男阅堋?/p>

更厲害的是，還能輕松做到自回歸模型做不到的事兒——文字補全。

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

要知道，非自回歸模型一直不被看好。

而這個“圣代”的文字補全功能，也為人類和機器共同編輯、創(chuàng)作文本提供了新的途徑。

非自回歸語言模型“圣代”

“圣代”全名“逐步展開降噪自動編碼器”（Step-unrolled Denoising Autoencoder，SUNDAE），作為一種新的文本生成模型，它不依賴于經(jīng)典的自回歸模型。

與降噪擴散技術(shù)（denoising diffusion）類似，“圣代”在訓(xùn)練期間采用展開降噪（unrolled denoising），將一系列token重復(fù)應(yīng)用，從隨機輸入開始，每次都對其進行改進，直至收斂。

這就是所謂的“自我糾正”過程。

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

下面用一張圖來說明一下降噪和展開降噪的區(qū)別。

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

第一行為原始文本，它被隨機“污染”（corrupt）后產(chǎn)生新的文本（第二行），其中綠色的token代表“未污染”文本，紅色代表“污染”文本。

這個中間文本再通過降噪（從生成模型中采樣），生成底部的又一個“污染”文本。

標(biāo)準降噪自動編碼器只學(xué)習(xí)從中間文本到頂部文本的映射，逐步展開降噪自動編碼器（“圣代”）則會學(xué)習(xí)從底部到頂部的映射。

而在文本生成期間，網(wǎng)絡(luò)遇到的大多數(shù)文本都并非像上圖中間那樣，而是底部那種，所以展開降噪是非常有用的。

此外，研究人員還提出了一個簡單的改進算子，它能實現(xiàn)比降噪擴散技術(shù)收斂所需的更少的迭代次數(shù)，同時在自然語言數(shù)據(jù)集上定性地生成更好的樣本。

直白的說，“圣代”采用的方法讓文本合成的質(zhì)量和速度都變得可控了。

在機器翻譯和文本生成任務(wù)上表現(xiàn)如何？

下面就來看看“圣代”的具體表現(xiàn)。

研究人員首先在機器翻譯基準上評估“圣代”。

使用BLEU分數(shù)作為衡量標(biāo)準，將“圣代”在WMT’14德英互譯任務(wù)上的翻譯質(zhì)量與自回歸模型（AR）和非AR模型進行比較。

結(jié)果發(fā)現(xiàn)，在不使用序列級知識蒸餾等技術(shù)的情況下，“圣代”的性能幾乎與AR模型相當(dāng)，并且打敗了所有非AR模型。

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

接著是對“圣代”在文本生成任務(wù)上的評估。

研究人員在大型高質(zhì)量公開數(shù)據(jù)集 Colossal Clean Common Crawl (C4) 上訓(xùn)練“圣代”。

模型一共包含335M參數(shù)，24層，embedding size為1024 , hidden size為4096 , 以及16 個attention head，使用bacth size為4096的Adam optimizer訓(xùn)練了多達40萬步。

最終生成的文本如下，未經(jīng)cherry pick：

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

這10句里面，除了第4，都挺合理。

不過由于C4數(shù)據(jù)集來自網(wǎng)絡(luò)，所以無論是訓(xùn)練集還是生成的最終結(jié)果，換行符都挺多。

此外，由于“圣代”模型的非自回歸性，研究人員也測試了它的文本“修復(fù)”能力。

要知道，這對于只能從左到右按序生成的AR模型來說根本就辦不到。

結(jié)果如下（cherry-pick過）：

C4數(shù)據(jù)集

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

GitHub上的Python程序組成的數(shù)據(jù)集

教自動編碼器學(xué)會「自我糾正」，DeepMind提出語言模型“SUNDAE”

大家覺得這效果如何？語法和邏輯似乎都沒有問題。

更多數(shù)據(jù)和內(nèi)容歡迎戳下方鏈接。

論文地址：

https://arxiv.org/abs/2112.06749

責(zé)任編輯：張燕妮來源：量子位

編碼器語言模型 DeepMind

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

主站蜘蛛池模板：欧美一级免费 | 91色在线视频 | 欧美11一13sex性hd | 欧美在线a | 欧美日韩精品久久久免费观看 | 一区二区精品视频 | 日本黄色一级片视频 | 欧美精品在欧美一区二区 | 四虎成人免费视频 | 91精品国产91久久综合桃花 | 亚洲精品亚洲人成人网 | 看av电影| 国产精品视频偷伦精品视频 | 亚洲国产欧美一区二区三区久久 | 亚洲免费在线观看 | 成人网视频 | 久久精品1| 亚洲视频欧美视频 | 天堂三级 | 国产a区 | 91精品中文字幕一区二区三区 | 免费观看一级特黄欧美大片 | 国产精品一区二区三区在线播放 | 北条麻妃视频在线观看 | 国产精品国产精品国产专区不卡 | 日韩成人精品一区二区三区 | 国产精品亚洲片在线播放 | 中文字幕在线观看 | 久久99久久99久久 | 国产日韩欧美二区 | 国产小视频精品 | 成人av在线播放 | 99久久婷婷国产亚洲终合精品 | 国产精品视频免费观看 | 国产日韩电影 | 手机看片169| 欧美黑人一级爽快片淫片高清 | 超碰成人在线观看 | 日本在线一二 | 国产精品视频一二三区 | 在线看成人av |

<blockquote id="uvdrx"><ruby id="uvdrx"></ruby></blockquote>

<blockquote id="uvdrx"><ruby id="uvdrx"></ruby></blockquote>

<address id="uvdrx"><ruby id="uvdrx"></ruby></address>

<blockquote id="uvdrx"><ruby id="uvdrx"></ruby></blockquote>