成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

新聞 系統(tǒng)運維
近日,麻省理工學院研究團隊發(fā)表了一篇論文指控知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,該論文還被國際機器學習大會ICML2020接收。

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權。

近日,麻省理工學院研究團隊發(fā)表了一篇論文指控知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,該論文還被國際機器學習大會ICML2020接收。

同時,這篇論文名為《From ImageNet to Image Classification: Contextualizing Progress on Benchmarks》,也發(fā)表在了在預印論庫arXiv上。

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

麻省理工研究團隊之所以在ICML大會上介紹這項研究,是因為近期陷入的“Tiny Images”爭議事件。

就在本月初,麻省理工學院(MIT)宣布永久刪除了包含8000萬張圖像的Tiny Images數(shù)據(jù)集,并公開表示歉意。其原因是,有關研究人員發(fā)表了一篇論文指控Tiny ImageNet數(shù)據(jù)集存在多項危險標簽,包括種族歧視、性別歧視、色情內(nèi)容等,而且指控有理有據(jù)。

論文中表明,ImageNet在語義結構分析上,使用的WordNet名詞,它包含了種族歧視等危險內(nèi)容,同時,由于圖像過小,數(shù)據(jù)量過大,并未手動對圖像標簽進行逐一核對,由此導致了問題的出現(xiàn)。

眾所周知,知名數(shù)據(jù)集ImageNet也使用了WordNet用于語義結構分析,那么,ImageNet數(shù)據(jù)集是否也存在同樣的問題?對此,麻省理工研究團隊給出了答案。

ImageNet基準測試與實際不符

大規(guī)模ImageNet數(shù)據(jù)集的出現(xiàn),可以說意味著機器學習深度變革的一個新起點。2009年,李飛飛領銜的研究團隊在計算機視覺與識別模式大會(CVPR)上首次推出ImageNet,ImageNet數(shù)據(jù)集包含10000個分類,超過一百萬個圖像,數(shù)據(jù)量之大是此從未有過的。

正是因數(shù)據(jù)量大、質(zhì)量高,ImageNet數(shù)據(jù)集被廣泛用于預訓練和基準測試。但是,麻省理工研究團隊在最近的研究中卻指出:

ImageNet存在明顯的“系統(tǒng)標注問題”,導致其用作基準數(shù)據(jù)集時與實際情況并不一致。

他們發(fā)現(xiàn),ImageNet數(shù)據(jù)集中大約有20%的圖像包含兩個或更多的對象目標。

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

在通過對多個目標識別模型進行分析后,數(shù)據(jù)表明包含多個對象目標的照片會導致總體基準的準確性下降10%。

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

簡單舉個栗子:假如此圖是ImageNet數(shù)據(jù)集中的一張高清圖像,我們可以看到圖片中不止包含了一個對象目標,有女孩、吉他和唱麥,而且圖片的主目標應該是女孩。

[[334142]]

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

但ImageNet的數(shù)據(jù)標簽可能不是女孩,也可能是唱麥或者吉他,重要的是ImageNet只會標注一個標簽,而這樣就可能會導致ImageNet在目標識別中出現(xiàn)失誤。

研究人員在論文中表明,

“總體而言,單個ImageNet標簽可能不能總是捕獲到ImageNet圖像的主要表物體目標。但是,當我們進行培訓和評估時,卻將標簽視為圖像的根本事實,因此,這可能會導致ImageNet基準測試與現(xiàn)實世界中的對象識別任務之間出現(xiàn)不一致,而且這在模型執(zhí)行和評估性能方面都是如此。”

看到這里你可能會疑惑,為什么不能準確對圖像進行標記?其實問題的關鍵在于ImageNet所使用的標記工具WorldNet。

WordNet名詞標記是關鍵

WordNet在1980年代由George Armitage Miller創(chuàng)立,被廣泛用于數(shù)據(jù)集的收集和標記過程。簡單的理解,ImageNet會根據(jù)WorldNet提供的名詞和它的語義層次結構,在搜索引擎或者Flickr之類的網(wǎng)站進行圖像搜索,作為數(shù)據(jù)集的初始來源。

當WordNet提供一個名詞后,根據(jù)它設定的語音層次結構,ImageNet需要對該名詞的父類節(jié)點同義詞進行擴充,并以此作為搜索的關鍵詞。比如“ whippet”分類名詞(父類節(jié)點為:“dog”)的搜索還會包括“ whippet dog” 。

這類似于我們經(jīng)常看到的“相關搜索”。為了進一步擴展圖像池,數(shù)據(jù)集創(chuàng)建者還會使用多種語言進行了搜索。

但這里的重點是,對于每個檢索到的圖像已經(jīng)確定了標簽,如果該標簽包含在數(shù)據(jù)集中,則將分配給該圖像。也就是說,標簽僅由用于相應搜索查詢的WordNet節(jié)點給出。

而在這一過程中,WordNet的語義結構會將非主要目標的圖像納入數(shù)據(jù)集中,進而出現(xiàn)上文提到標記偏差。如論文中的數(shù)據(jù)顯示,同一分類標簽卻出現(xiàn)了不同的物體目標。(如圖)

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

既然如此,那為什么WordNet名詞還能夠廣泛應用于數(shù)據(jù)集創(chuàng)建過程中呢?

一方面是因為WorldNet可以完成大量數(shù)據(jù)的自動標記工作。我們知道,所有數(shù)據(jù)集在使用前都要先完成標記任務,而一個優(yōu)秀的數(shù)據(jù)集規(guī)模又是很大的,如果全部手動標記,難度非常高,而WorldNet卻可以很好的解決這一問題。

另一方面對于ImageNet而言,WordNet獲取的只是初始數(shù)據(jù)標簽,其準確性還需要通過相關模型進行再次驗證。總體來講,ImageNet數(shù)據(jù)集的創(chuàng)建過程,分為自動圖像收集(automated data collection)和眾包過濾(crowd-sourced filtering)兩個階段,而眾包過濾就是所謂的審核階段,它分為以下5個步驟:

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

  • 潛在標簽(Candidate Labels):通過現(xiàn)有ImageNet圖像標簽與模型預測的前5個標簽進行組合,獲得每張圖像的潛在標簽。
  • 選擇高頻率標簽(Selection Frequency):通過Mechanical Turk(MTurk)平臺,將潛在標簽與注釋內(nèi)容對比,經(jīng)過反復過濾循環(huán)后,出現(xiàn)頻率最高的為最佳標簽(一般少于5個)。
  • CLASSIFY任務:給獲得的少量多標簽(Multiple labels)重新定義一組新的注釋內(nèi)容,根據(jù)注釋信息為不同對象賦予標簽,并確定一個主要對象的標簽,這個過程稱為CLASSIFY。
  • 對象注釋(Object Annotation):匯總以上訓練后,獲得更為細粒度的圖像注釋;

與原始ImageNet標簽相比,經(jīng)過眾包過濾后生成的注釋能夠以更細粒度的方式表征圖像的內(nèi)容,但研究者發(fā)現(xiàn),這些注釋內(nèi)容可能并沒有達到期待的效果,如下圖,CONTAINS任務會選擇多個標簽對圖像有效,而對于70%的圖像而言,注釋選擇的標簽頻率至少是ImageNet的原始標簽的一半。

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet而且下圖表明,盡管只感知到單個對象,它們也經(jīng)常會選擇多達10個類別標簽。因此,對于單一目標的圖像,ImageNet驗證過程也無法得到準確的標簽。

慘遭下架后,MIT再爆知名數(shù)據(jù)集ImageNet存在系統(tǒng)性Bug,禍端還是WordNet

因此,可以說圖像標簽在很大程度上依然取決于自動檢索(WorldNet)過程,同時眾包過濾的審查過程還有很大的提升空間。

對于未來如何優(yōu)化數(shù)據(jù)集的創(chuàng)建任務,研究人員在論文中表明,我們認為開發(fā)注釋流程,尤其是審查階段以更好地捕獲基本事實,同時保持可擴展性是未來研究的重要途徑。”

涉嫌種族歧視,大規(guī)模數(shù)據(jù)集爭議不斷

作為人工智能技術的基礎,數(shù)據(jù)集在諸多研究領域都有著廣泛的使用場景,尤其是在計算機視覺領域。近些年,因數(shù)據(jù)集的使用引發(fā)的隱私泄露、種族歧視等問題接連不斷,導致人工智能技術的發(fā)展備受爭議。

除了近期麻省理工學院因涉嫌種族歧視而刪除了包含8000張圖像的Tiny Image數(shù)據(jù)外,此前,一款圖像修復算法PULSE,在學術圈同樣引起軒然大波。有網(wǎng)友發(fā)現(xiàn),PULSE在修復馬賽克圖像時,將奧巴馬的人臉圖像變成了高分辨率的白人,這一事件引起了黑人網(wǎng)友的不滿。

對此,圖靈獎之父Lecun發(fā)表twitter稱,訓練結果存在種族偏見,是因為數(shù)據(jù)集本身帶有偏見,工程師在使用過程中應該注意這一點。

今年因數(shù)據(jù)集而引發(fā)種族歧視事件頗多,而解決這些數(shù)據(jù)集爭議,無非是從數(shù)據(jù)收集和標記階段進行改進。研究人員稱,對于大型數(shù)據(jù)集,理想的方法是按指定目標在全世界范圍內(nèi)收集圖像,并讓專家按確切類別進行手動篩選和標記。這里需要注意的是,非專家的人工標記也可能出現(xiàn)錯誤。

但從當前來看,這種方法非常不切實際。事實上,諸如ImageNet此類數(shù)據(jù)集均是從互聯(lián)網(wǎng)搜索引擎抓取的圖像,質(zhì)量參差不齊,而圖像審查不夠嚴謹。同時大量數(shù)據(jù)的專家手動標記也很難實現(xiàn)。不過,如本次研究所稱,可以通過技術進一步改善圖像自動審查的過程來提高數(shù)據(jù)集的質(zhì)量。

此外,目前學術界已經(jīng)越來越關注數(shù)據(jù)集相關缺陷問題,在本月初計算機語言協(xié)會(ACL)還重點討論了這一問題。

 

 

責任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關推薦

2021-03-19 08:00:00

網(wǎng)絡安全漏洞數(shù)據(jù)安全

2020-07-02 14:25:06

數(shù)據(jù)庫工具技術

2021-09-24 16:16:27

iOS蘋果系統(tǒng)

2009-09-03 14:06:47

紅帽RHELPerl

2022-07-27 11:45:43

iOS蘋果系統(tǒng)

2020-03-02 16:25:03

性能系統(tǒng)軟件

2015-08-31 10:09:34

2023-02-01 18:31:03

陳峰 數(shù)倉寶貝庫

2024-12-04 13:33:43

2010-02-05 15:09:50

2019-09-16 09:29:52

爬蟲數(shù)據(jù)支付寶

2015-11-16 16:00:21

2023-06-19 10:09:01

數(shù)學AI

2023-05-15 08:44:15

Redis數(shù)據(jù)庫

2018-03-12 12:44:59

數(shù)據(jù)科學家人工智能數(shù)據(jù)科學

2023-05-23 08:00:00

數(shù)據(jù)集ImageNet算法

2009-04-30 17:12:50

2020-11-19 19:32:27

漏洞微軟Windows

2010-12-13 11:19:02

2014-05-20 15:50:16

LinuxWindows XP
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产激情91久久精品导航 | 高清成人av | 91porn国产成人福利 | 日本精品视频一区二区三区四区 | av香蕉| 中文字幕av亚洲精品一部二部 | 人人九九精 | 精品粉嫩aⅴ一区二区三区四区 | 午夜视频一区二区 | 亚洲国产成人久久久 | av在线成人| 国产欧美一区二区三区日本久久久 | h视频在线免费观看 | 久久国产一区二区三区 | 一级毛片免费视频 | 伊人春色在线 | 国产不卡在线播放 | 久久在看 | 国产露脸国语对白在线 | 国产成人99久久亚洲综合精品 | 91久久久久久久久久久久久 | 日本精品久久久一区二区三区 | 亚洲精品一区在线观看 | 韩国精品在线观看 | 日韩欧美在线不卡 | 国产精品国产三级国产aⅴ无密码 | av大片| 天天综合久久 | 久久伊人影院 | 午夜视频一区二区三区 | 日韩中文一区 | www.五月婷婷.com | 日本视频中文字幕 | 亚洲男人的天堂网站 | 久久久精 | 精品1区 | 777毛片| 青青草原综合久久大伊人精品 | 亚洲精品自在在线观看 | 一区二区三区四区国产 | 国产最新精品视频 |