成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<button id="tmhxp"><form id="tmhxp"></form></button>

<output id="tmhxp"><option id="tmhxp"></option></output>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

何愷明新作：消除數據集偏差的十年之戰

2024-03-25 10:15:58

人工智能新聞

瞄準一個橫亙在AI發展之路上十年之久的問題：數據集偏差。

MIT新晉副教授何愷明，新作新鮮出爐：

瞄準一個橫亙在AI發展之路上十年之久的問題：數據集偏差。

該研究為何愷明在Meta期間與劉壯合作完成，他們在論文中指出：

盡管過去十多年里業界為構建更大、更多樣化、更全面、偏差更小的數據集做了很多努力，但現代神經網絡似乎越來越善于”識破”并利用這些數據集中潛藏的偏差。

這不禁讓人懷疑：我們在消除數據集偏差的戰斗中，真的取得了勝利嗎？

數據集偏差之戰，在2011年由知名學者Antonio Torralba和Alyosha Efros提出——

Alyosha Efros正是Sora兩位一作博士小哥（Tim Brooks和William Peebles）的博士導師，而Antonio Torralba也在本科期間指導過Peebles。

當時他們發現，機器學習模型很容易“過擬合”到特定的數據集上，導致在其他數據集上表現不佳。

十多年過去了，盡管我們有了更大、更多樣化的數據集，如ImageNet、YFCC100M、CC12M等，但這個問題似乎并沒有得到根本解決。

反而，隨著神經網絡變得越來越強大，它們“挖掘”和利用數據集偏差的能力也越來越強了！

為了分析這個問題，何愷明團隊設計了一個虛構的”數據集分類”任務。

聽名字你可能就猜到了：給定一張圖像，模型需要判斷它來自哪個數據集。通過看模型在這個任務上的表現，就可以了解它們捕捉數據集偏差的能力。

現代AI輕松識破不同數據集

在實驗中團隊發現，各種現代神經網絡架構，如AlexNet、VGG、ResNet、ViT等，在數據集分類任務上表現出驚人的一致性：它們幾乎都能以超過80%的準確率區分不同數據集的圖像！

更令人吃驚的是，這個發現在各種不同的條件下都非常穩?。?/p>

不管是不同的數據集組合、不同的模型架構、不同的模型尺寸、不同的訓練數據量，還是不同的數據增強方法，神經網絡始終能輕松”一眼識破”圖像的數據集來源。

那么，神經網絡是如何做到這一點的呢？是靠單純的記憶，還是學到了一些更普適的規律？

為了揭開謎底，團隊做了一系列對比實驗。他們發現，如果把不同的數據集隨機混在一起，神經網絡就很難再區分它們了（準確率下降到了33%）。這說明，神經網絡并不是在單純地記憶每一張圖像，而是真的學到了一些數據集特有的模式。

更有趣的是，即使在自監督學習的設置下，神經網絡也展現出了驚人的”數據集辨識力”。在這種設置下，模型在訓練時并沒有用到任何數據集的標簽信息，但當在這些自監督學習到的特征上訓練一個簡單的線性分類器時，它依然能以超過70%的準確率區分不同的數據集！

通過這一系列的實驗，何愷明、劉壯等人的研究給我們敲響了警鐘：盡管這十年我們一直在努力構建更大、更多樣化的數據集，但數據集偏差這個問題似乎并沒有得到根本解決。相反，現代神經網絡越來越善于利用這些偏差來獲得高準確率，但這可能并不代表它們真正學到了魯棒、普適的視覺概念。

論文的最后，作者呼吁整個AI社區重新審視數據集偏差這個問題，并重新思考如何在算法和數據兩個層面上來應對這一挑戰。

CVPR最佳論文作者的通力合作

本文是何愷明在Meta期間，與Meta研究科學家劉壯合作完成。

現在，何愷明已經正式在MIT上崗，擔任電氣工程與計算機科學系的助理教授。他的“開學第一課”開課即火爆，在youtube上已經有2.9萬的播放量。

和何愷明一樣，劉壯本科畢業自清華，并且也是CVPR最佳論文獎得主——他是CVPR2017最佳論文DenseNet的第一作者。

2017年，劉壯從清華姚班畢業，進入加州大學伯克利分校攻讀博士學位，師從Trevor Darrell，是賈揚清的同門師弟。

博士畢業后，劉壯進入Meta AI Research工作。在此之前，他已經在Meta實習了一年多時間，期間和謝賽寧合作，發表了ConvNeXt。

論文地址：
https://arxiv.org/abs/2403.08632

責任編輯：張燕妮來源：自動駕駛之心

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：中文字幕一区二区三区四区五区 | 欧美一级欧美一级在线播放 | 一区二区精品 | 91网站视频在线观看 | 国产成人精品一区二区三区四区 | 久久国产精品免费 | 欧美激情综合网 | 日韩欧美精品在线 | 久久久亚洲 | 亚洲精品成人av久久 | 青青久久 | 国产精品999| 成人一区二区三区在线观看 | 成人精品视频99在线观看免费 | 欧美13videosex性极品 | 亚洲欧洲精品一区 | 日韩美av| 国产成人av免费看 | 日韩精品一区二区在线 | 欧美精品在线观看 | 嫩草视频网站 | 午夜视频在线观看视频 | 在线播放第一页 | 日本精品久久 | 国产免费av在线 | 99精品国产一区二区三区 | 国产成人在线一区二区 | 日本高清视频在线播放 | 国产欧美一级二级三级在线视频 | 国产精品永久久久久久久www | 久久久国产一区二区三区 | 久草视频网站 | 欧美在线一区二区三区 | 亚洲成人精品一区二区 | 久久久久久免费毛片精品 | 91精产国品一二三区 | 第一区在线观看免费国语入口 | 日日综合 | 狠狠插天天干 | 亚洲毛片在线观看 | 久久丝袜|

<abbr id="joaat"><pre id="joaat"></pre></abbr>

<abbr id="joaat"><style id="joaat"><i id="joaat"></i></style></abbr>