成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

給機(jī)器下「遺忘咒」?谷歌發(fā)起首個機(jī)器遺忘挑戰(zhàn)賽

人工智能 新聞
給機(jī)器來一杯「忘情水」,這算不算機(jī)器遺忘?近日,谷歌 AI 宣布聯(lián)合廣泛的學(xué)界與業(yè)界研究團(tuán)隊(duì),組織首個機(jī)器遺忘挑戰(zhàn)賽(Machine Unlearning Challenge)。

機(jī)器學(xué)習(xí)經(jīng)常被提及,那你有聽過機(jī)器遺忘嗎?

機(jī)器學(xué)習(xí)的目的大家都了解,它能夠幫助我們的工作提升效率。但是機(jī)器遺忘是何目的?難道是「棄學(xué)」?

圖片

現(xiàn)在,不僅關(guān)于機(jī)器話題的討論變得火熱,甚至出現(xiàn)專門為機(jī)器遺忘組織的挑戰(zhàn)。

近日,谷歌 AI 宣布聯(lián)合廣泛的學(xué)界與業(yè)界研究團(tuán)隊(duì),組織首個機(jī)器遺忘挑戰(zhàn)賽(Machine Unlearning Challenge)。

至于舉辦這一機(jī)器遺忘挑戰(zhàn)賽的目的,谷歌表示希望有助于推進(jìn)機(jī)器遺忘的 SOTA 水平,并鼓勵開發(fā)高效、有效和合乎道德的遺忘算法。

圖片圖片

比賽內(nèi)容都有啥?

具體地講,該挑戰(zhàn)賽考慮這樣一個真實(shí)場景:其中一個年齡預(yù)測器在人臉圖像數(shù)據(jù)上進(jìn)行了訓(xùn)練,接著在訓(xùn)練后,訓(xùn)練圖像的某個子集必須被遺忘,以保護(hù)相關(guān)個人的隱私或其他權(quán)利。

圖片圖片

摘自 Face synaesthetics 數(shù)據(jù)集的圖像以及年齡注釋。

比賽將在 Kaggle 平臺上舉辦,提交的作品將根據(jù)遺忘質(zhì)量和模型實(shí)用性進(jìn)行自動評分。

其中對于評估遺忘,本次挑戰(zhàn)賽將使用受成員推理(Membership inference attacks, MIAs)啟發(fā)的工具,如 LiRa。MIAs 最初是在隱私和安全文獻(xiàn)中開發(fā),其目的是推斷哪些示例是訓(xùn)練集的一部分。

直白地講,如果遺忘成功,遺忘過的模型中將不包含被遺忘示例的痕跡,這會導(dǎo)致 MIA 失敗,即進(jìn)攻者無法獲知被遺忘集實(shí)際上是原始訓(xùn)練集的一部分。

此外,評估中還將使用統(tǒng)計(jì)測試來量化「遺忘模型的分布」與從頭開始重新訓(xùn)練的模型的分布的差異程度。

相關(guān)比賽的信息可以查閱以下兩個鏈接:

或許有讀者要問了,為什么在機(jī)器學(xué)習(xí)的浪潮中,還會有這樣一股機(jī)器遺忘的「逆流」奔涌呢?

什么是機(jī)器遺忘

機(jī)器遺忘是機(jī)器學(xué)習(xí)的一個新興領(lǐng)域,最終目的是消除一個訓(xùn)練模型特定訓(xùn)練樣本子集的影響,即消除「遺忘集」(forget set)的影響。

此外,較為理想的遺忘算法在消除某些樣本影響的同時,還應(yīng)該保留其他有益的特性,比如在其余訓(xùn)練集上的準(zhǔn)確性以及對保留樣本的泛化性。

下圖為遺忘學(xué)習(xí)的剖析。遺忘算法將一個預(yù)訓(xùn)練模型以及要遺忘的訓(xùn)練集中的一個或多個樣本作為輸入。然后基于該模型、遺忘集和保留集,遺忘算法會生成一個更新模型。理想遺忘算法生成的模型與沒有遺忘集參與訓(xùn)練的模型沒有區(qū)別。

圖片圖片

其實(shí),有一個很「暴力」的方法能夠得到這種理想的模型,就是在排除遺忘集樣本后,重新訓(xùn)練模型。這個「暴力」手段雖立竿見影,但并不可行,因?yàn)橹匦掠?xùn)練深度模型的成本實(shí)在太過高昂。

因此,遺忘學(xué)習(xí)算法應(yīng)該是以訓(xùn)練好的模型作為基點(diǎn),并對其進(jìn)行調(diào)整,來消除所要求數(shù)據(jù)帶來的影響。

機(jī)器遺忘學(xué)習(xí)不僅僅應(yīng)用于保護(hù)用戶隱私,還能夠通過訓(xùn)練,刪除訓(xùn)練模型中不準(zhǔn)確或者過時的信息,甚至是異常或者有害的數(shù)據(jù)。當(dāng)然,這比消除幾個指定遺忘集難度大得多,這也意味著它更有用處,比如它可以通過糾正偏見或?qū)儆诓煌后w的歧視來提高模型的公平性。

「清掃、清掃,全都扔掉」「清掃、清掃,全都扔掉」

為何要發(fā)展機(jī)器遺忘

大家都受益于網(wǎng)絡(luò)信息的易得性,但是往往忽略了在整個網(wǎng)絡(luò)上刪除某一信息的艱難。這堪比將一捧沙子撒入海里,再從不斷涌動的海水中將沙粒一個個撿起,更重要的是,這些沙粒有不斷復(fù)制的可能。

由此可見,信息及時被刪除了也能通過各種手段有所保留。

在網(wǎng)絡(luò)中留下的足跡,雖可能不被查詢,但印記永存。2012 歐盟委員會就曾公布草案提出數(shù)據(jù)主體應(yīng)享有「被遺忘權(quán)」。這對大數(shù)據(jù)背景下互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展具有深遠(yuǎn)而廣泛的影響。

更別說近期正火熱的大型語言模型,更是以海量的數(shù)據(jù)集作為基礎(chǔ)進(jìn)行發(fā)展的。大模型對于訓(xùn)練集的細(xì)節(jié)內(nèi)容會進(jìn)行學(xué)習(xí)和記憶,其中不乏用戶的隱私信息,這導(dǎo)致可能涉及的隱私風(fēng)險更加嚴(yán)峻。

因此機(jī)器學(xué)習(xí)模型中的安全和隱私問題是研究者必定面臨的挑戰(zhàn)。

圖片圖片

網(wǎng)友表示,這場挑戰(zhàn)賽將推動隱私保護(hù)。

在這樣艱難、復(fù)雜的條件下,機(jī)器遺忘應(yīng)運(yùn)而生,有關(guān)于它的討論和學(xué)習(xí)也日益成為機(jī)器學(xué)習(xí)領(lǐng)域的焦點(diǎn)之一。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-08-21 09:57:38

2023-07-21 12:48:37

2024-08-26 08:45:00

機(jī)器模型

2017-03-28 17:18:20

2017-09-19 19:58:20

聯(lián)想超融合

2017-05-02 11:26:36

開發(fā)者、Java、PH

2014-03-13 18:02:57

SAPd-codeLumira

2022-10-14 15:27:02

應(yīng)用開發(fā)鴻蒙

2022-10-10 15:01:35

手寫板鴻蒙

2025-05-19 14:55:41

機(jī)器人訓(xùn)練AI

2021-06-21 10:26:09

Linuxgpio_keys代碼

2016-05-17 14:24:56

亞馬遜機(jī)器學(xué)習(xí)

2018-06-12 00:33:20

AI機(jī)器學(xué)習(xí)人工智能

2022-10-20 08:02:29

ELFRTOSSymbol

2014-05-16 15:39:35

Esri開發(fā)者大會APP

2009-07-23 11:39:42

網(wǎng)易有道有道難題

2023-02-28 12:38:22

谷歌數(shù)據(jù)集機(jī)器翻譯

2023-02-28 13:13:51

AI智能

2009-09-03 09:08:08

Linuxroot密碼遺忘

2020-07-20 11:23:24

信息安全個人信息數(shù)據(jù)安全
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 色橹橹欧美在线观看视频高清 | 激情视频网站 | 一区二区三区精品在线视频 | 成人伊人 | 欧日韩不卡在线视频 | 国产激情在线观看视频 | 天堂网avav | 成人在线视频免费看 | 亚洲欧洲精品成人久久奇米网 | 国产精品久久久久影院色老大 | 在线观看成人精品 | 国产91在线播放 | 99热这里只有精品8 激情毛片 | 手机av在线 | 日本中文字幕日韩精品免费 | 午夜影院在线观看视频 | 欧美激情黄色 | 欧美最猛性xxxxx亚洲精品 | 成人免费黄色片 | 一区在线播放 | 2021狠狠天天天 | 国产一区二区三区亚洲 | 亚洲91| 欧美大片一区二区 | 日本黄色不卡视频 | 国产一区二区三区网站 | 久久精品成人 | 一级片免费视频 | 91精品国产91久久综合桃花 | 精品视频免费 | 狠狠爱综合 | 亚洲成人av在线播放 | 91亚洲国产成人精品一区二三 | 国产精品视频网址 | 国产毛片视频 | 亚州av| 久久免费看| 欧美理论在线观看 | 久久精品这里 | 天天色天天射天天干 | 亚洲一区二区国产 |