深度學習與神經網絡:最值得關注的6大趨勢
神經網絡的基本思想是模擬計算機“大腦”中多個相互連接的細胞,這樣它就能從環境中學習,識別不同的模式,進而做出與人類相似的決定。
典型的神經網絡是由數千互連的人工神經元組成,神經元是構成神經網絡的基本單位。這些神經元按順序堆疊在一起,以稱為層的形式形成數百萬個連接。單位劃分如下:
- 輸入單元:用于接收外部環境的信息;
- 隱藏單元:隱藏層將所需的計算及輸出結果傳遞給輸出層;
- 輸出單元:輸出信號表明網絡是如何響應最近獲得的信息。
多數神經網絡都是“全連接的”,也就是說,每一個隱藏單元和輸出單元都與另一邊的所有單元相連接。每個單元之間的連接稱為“權重”,權重可正可負,這取決于它對另一個單元的影響程度。權重越大,對相關單元的影響也就越大。
前饋神經網絡是一種最簡單的神經網絡,各神經元分層排列。每個神經元只與前一層的神經元相連。接收前一層的輸出,并輸出給下一層,各層間沒有反饋。是目前應用最廣泛、發展最迅速的人工神經網絡之一。
下面將就神經網絡與深度學習發展的幾大重要趨勢進行討論:
1. 膠囊網絡(Capsule Networks)
膠囊網絡是一種新興的深層神經網絡,其處理信息的方式類似于人腦。
膠囊網絡與卷積神經網絡相反,雖然卷積神經網絡是迄今為止應用最廣泛的神經網絡之一,但其未能考慮簡單對象和復雜對象之間存在的關鍵空間層次結構。這導致了誤分類并帶來了更高的錯誤率。
在處理簡單的識別任務時,膠囊網絡擁有更高的精度,更少的錯誤數量,并且不需要大量的訓練模型數據。
2. 深度強化學習(Deep Reinforcement Learning, DRL)
深度強化學習是神經網絡的一種形式,它的學習方式是通過觀察、行動和獎勵,與周圍環境進行交互。深度強化學習已經被成功地用于游戲策略的制定,如Atari和Go。AlphaGo擊敗了人類冠軍棋手,是深度強化學習最為著名的應用。
3. 數據增強(Lean and augmented data learning)
到目前為止,機器學習與深度學習遇到的***挑戰是:需要大量使用帶標簽的數據來訓練系統。目前有兩種應用廣泛的技巧可以幫助解決這個問題:
- 合成新的數據
- 遷移學習
“遷移學習”,即把從一個任務或領域學到的經驗遷移到另一個任務或領域,“一次學習”指遷移學習應用到極端情況下,在只有一個相關例子,甚至沒有例子的情況下學習。由此它們成為了“精簡數據”的學習技巧。與之相仿,當使用模擬或內插合成新的數據時,它有助于獲取更多的訓練數據,因而能夠增強現有數據以改進學習。
通過運用上述技巧,我們能夠解決更多的問題,尤其是在歷史數據較少的情況下。
4. 監督模型(Supervised Model)
監督模型時一種學習形式,它根據預先標記的訓練數據學到或建立一個模式,并依此模式推斷新的實例。監督模型使用一種監督學習的算法,該算法包括一組輸入和標記正確的輸出。
將標記的輸入與標記的輸出進行比較。給定兩者之間的變化,計算一個誤差值,然后使用一個算法來學習輸入和輸出之間的映射關系。
5. 網絡記憶模型(Networks With Memory Model)
人類和機器的一個典型區別在于工作和嚴謹思考的能力。我們可以對計算機進行編程,使其以極高的準確率完成特定的任務。但是如果我們想要它在不同的環境中工作,還有需要解決很多問題。
要想使機器適應現實世界的環境,神經網絡必須能夠學習連續的任務且不產生“災難性忘卻(catastrophic forgetting)”,這便需要許多方法的幫助,如:
- 長期記憶網絡(Long-Term Memory Networks):它能夠處理和預測時間序列
- 彈性權重鞏固算法(Elastic Weight Consolidation, EWC):該方法能夠選擇性地減慢對這些任務而言比較重要的權重的學習速率
- 漸進式神經網絡(Progressive Neural Networks):不會產生“災難性忘卻”,它能夠從已經學會的網絡中提取有用的特征,用于新的任務
6. 混合學習模式(Hybrid Learning Models)
不同類型的深度神經網絡,例如生成式對抗網絡(GANs)以及深度強化學習(DRL),在性能提升和廣泛應用方面展現了了巨大的潛力。不過,深度學習模型不能像貝葉斯概率那樣為不確定性的數據場景建模。
混合學習模式結合了這兩種方法的優勢,典型的混合學習模式包括貝葉斯生成對抗網絡(Bayesian GANs)以及貝葉斯條件生成對抗網絡(Bayesian Conditional GANs)。
混合學習模式將商業問題的范圍擴大,使其能夠解決具有不確定性的深度學習問題,從而提高模型的性能,增強模型的可解釋性,實現更加廣泛的運用。