成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

深度學習遇上稀缺數據就無計可施?這里有幾個好辦法!

人工智能 深度學習 大數據
本文就讓我介紹幾個在有限的數據上使用深度學習的方法,以及闡述為什么我認為這可能是未來研究中最令人興奮的領域之一。

對于深度學習而言,在有很多數據的情況下,再復雜的問題也不在話下,然而沒有這么多數據呢?本文作者 Tyler Folkman 針對這一問題,為大家介紹了幾個在有限的數據上使用深度學習的方法,讓深度學習即便在面臨數據稀缺時,也能大展身手。

[[285157]]

眾所周知,深度學習是有史以來最棒的事情。它能夠在大量數據上以低成本解決復雜問題。唯一的問題是你既不在谷歌工作,也不在臉書工作,你的數據是稀缺的,那么你該怎么辦?你是能繼續使用是深度學習的能力,還是已無計可施?

下面就讓我介紹幾個在有限的數據上使用深度學習的方法,以及闡述為什么我認為這可能是未來研究中最令人興奮的領域之一。

一、先從簡單的開始

在我們探討在有限的數據上使用深度學習的方法之前,請先從神經網絡后退一步,建立一個簡單的基線。用一些傳統模型(如隨機森林)進行實驗通常不會花費很長時間,而這將有助于評估深度學習的所有潛在提升,并針對你的問題提供更多權衡深度學習方法和其他方法的視角。

二、獲取更多數據

這聽起來可能很荒謬,但是你真的考慮過自己能否收集更多的數據嗎?我經常向公司提出獲取更多數據的建議,但他們視我的建議如瘋人瘋語,這讓我很吃驚。是的,投入時間和金錢去收集更多的數據是可行的,而事實上,這通常也是你最好的選擇。例如,也許你正試圖對稀有鳥類進行分類,但數據非常有限。幾乎可以肯定地說,你可以僅僅通過標注更多的數據來比較輕易地解決這個問題。你不確定需要收集多少數據?對此,你可以在增加額外的數據時嘗試繪制學習曲線(相關教程鏈接),并同時查看模型性能的變化,從而確定所需的數據量。

三、微調

 

[[285158]]

攝影作者 Drew Patrick Miller,來源 Unsplash(網站鏈接)

 

現在假設你已經有一個簡單的基線模型,且在獲取更多數據上要么不可行要么太昂貴。此時最可靠和正確的方法是利用預訓練模型,然后針對你的問題對模型進行微調。

微調的基本思想是取一個一定程度上跟模型所在域相似的非常大的數據集,訓練一個神經網絡,然后用你的小數據集對這個預先訓練好的神經網絡進行微調。你可以在 A Comprehensive guide to Fine-tuning Deep Learning Models in Keras 這篇文章閱讀更多內容:

文章鏈接

對于圖像分類問題,最常用的數據集是 ImageNet。這個數據集涵蓋目標多個類的數百萬張圖像,因此可以用于許多類型的圖像問題。它甚至包括動物,因此可能有助于稀有鳥類的分類。

若需要使用一些用于微調的代碼,請參閱 Pytorch 的教程(教程鏈接)。

四、數據增強

如果你無法獲得更多的數據,并且無法成功地對大型數據集進行微調,那么數據增強通常是你接下來的最佳選擇。它還可以與微調一起使用。

數據增強背后的思想很簡單:在不改變標簽值的情況下,以提供新數據的方式改變輸入。

例如,你有一張貓的圖片,旋轉圖片后仍然是一張貓的圖片,這便是一次不錯的數據增強。另一方面,如果你有一張道路的圖片,想要預測適當的方向盤轉度(自動駕駛汽車),若旋轉這張道路的圖片將會改變適當的方向盤轉度,除非你把方向盤轉度調整到適當位置,否則難以預測成功。

數據增強是圖像分類問題中最常見的方法,相關的技術可以在這個網站獲取。

你也可以經常思考一些創造性的方式來將數據增強應用到其他領域,例如 NLP(相關示例可參考),同時大家也在嘗試使用 GANs 來生成新數據。如果對 GAN 方法感興趣,可以閱讀《深度對抗數據增強》(Deep Adversarial Data Augmentation)這篇文章(文章鏈接)。

五、余弦損失

深度學習遇上稀缺數據就無計可施?這里有幾個好辦法!

最近的一篇論文《不使用余弦損失進行預訓練的情況下在小數據集上進行深度學習》(Deep Learning on Small Datasets without Pre-Training using Cosine Loss)(論文鏈接)發現,在分類問題中將損失函數從分類交叉熵損失轉換為余弦損失時,小數據集的準確率提高了 30%,而余弦損失僅為“ 1 - 余弦相似度”。

從上圖中可以看出,基于每個類的樣本數量的性能是如何變化的,以及微調對于一些小型數據集(CUB)是多么有價值,而對于其他數據集(CIFAR-100)則沒有那么有價值。

六、深入

在一篇 NIPS 論文《小數據集的現代神經網絡泛化》(Modern Neural Networks Generalize on Small Data Sets)(論文鏈接)種,作者將深度神經網絡視為集合。具體來說,即「與其說每一層都呈現出不斷增加的特征層次,不如說最后一層提供了一種集成機制。」

從中得到的關于小數據的益處是確保你建立的深度網絡能利用這種集成效應。

七、自編碼器

現在已有通過采用更多優化的起始權重成功使用堆棧自編碼器對網絡進行預訓練的案例(該案例可參考論文「Using deep neural network with small dataset to predict material defects」)。這樣可以避免局部優化和其他不良初始化的陷阱。不過,Andrej Karpathy 建議不要對無監督預訓練過度興奮(相關文章可參考:http://karpathy.github.io/2019/04/25/recipe/)。

如果你需要復習自編碼器相關知識,可以看看斯坦福大學的深度學習教程(網址)。自編碼器的基本思想是建立一個預測輸入的神經網絡。

八、先驗知識

[[285159]]

圖 4:攝影作者 Glen Noble,來源 Unsplash(網站鏈接)

最后一點是嘗試找到結合特定領域知識的方法,以指導學習過程。例如,在論文《通過概率程序規劃歸納進行類人概念學習》(Human-level concept learning through probabilistic program induction,論文鏈接)中,作者構建了一個能夠在學習過程中利用先驗知識從部分概念中構造整體概念的模型,這樣的模型能夠實現人類水平的性能,并超出了當時的深度學習方法。

你也可以使用域知識來限制對網絡的輸入,以降低維度或將網絡體系結構調整的更小。

我將其作為最后的選擇,是因為結合先驗知識可能是一個挑戰,通常也是最耗費時間的。

九、讓深度學習在小數據上也能變得很酷

希望本文為你提供了一些關于如何在有限的數據上使用深度學習技術的思路。我個人認為,這是一個目前沒有得到足夠討論的問題,但它具有令人非常興奮的意義。

大量問題的數據非常有限,因為獲取更多的數據要么非常昂貴要么不可行,就比如說檢測罕見疾病或教育成果。找到方法來應用深度學習等最好的技術來解決這些問題是非常令人興奮的!正如吳恩達(Andrew Ng)也曾提到:

深度學習遇上稀缺數據就無計可施?這里有幾個好辦法!

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

責任編輯:未麗燕 來源: 雷鋒網
相關推薦

2017-05-18 18:40:45

2009-11-16 17:00:41

安全專家垃圾短信

2011-08-29 18:42:12

2011-06-22 09:52:44

2010-04-02 10:13:43

CentOS系統

2009-10-28 15:04:55

2021-02-25 13:45:04

Windows 10Windows微軟

2018-04-24 15:13:14

2010-04-16 16:55:48

Oracle屏蔽

2011-12-23 09:37:59

云計算

2011-12-25 20:45:19

云計算云安全

2019-07-03 15:16:56

機器學習數據項目

2018-03-25 09:11:31

大數據機器學習分析軟件

2016-03-31 17:06:02

2018-04-02 11:22:31

大數據Hadoop數據處理

2021-04-24 22:45:52

Windows 10Windows微軟

2018-04-19 14:42:48

深度學習DL數據集

2020-08-10 06:31:01

React Hooks前端開發

2020-11-02 15:49:35

機器學習技術云計算

2017-10-22 15:34:34

手機內存清理內存手機
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品久久777777 | 久久精品色欧美aⅴ一区二区 | 国产日韩一区二区三区 | 国产高清亚洲 | japanhd成人| 精品国产亚洲一区二区三区大结局 | 黄色网址av | 懂色av色香蕉一区二区蜜桃 | 久久久久久久久久毛片 | 亚洲欧洲成人在线 | 91国内精品 | 欧美精品一区二区三区在线 | 精品av | 国产日韩欧美二区 | 琪琪午夜伦伦电影福利片 | 中文字幕亚洲国产 | 天天插天天操 | 一区二区三区在线观看视频 | 成人小视频在线观看 | 蜜桃传媒一区二区 | 欧美日韩国产免费 | 国产成人高清在线观看 | 亚洲欧美日韩精品久久亚洲区 | 欧美一区二区三区在线播放 | 色婷婷九月 | 日韩高清av | 国产一区二区欧美 | 亚洲精品2区 | 精品国产伦一区二区三区观看说明 | 欧美激情亚洲激情 | 精品国产一区二区在线 | 色婷婷av久久久久久久 | 欧美一区二区三区在线播放 | 色婷婷婷婷色 | 成人毛片网| 五月综合久久 | 99精品国产一区二区三区 | 日本在线一二 | 色黄视频在线 | 91色在线 | 欧美黄色片在线观看 |