想真正理解深度學習?需要知道這三件事
對于喜歡數據的專業人士來說,潛水堪稱完美運動,因為收集數據是潛水的重要組成部分。慢慢地下降到深海中,你可以想象自己首次浸入未被開發的數據湖中。在成千上萬的水下生物中,你可以尋找最大的魚、最艷麗的珊瑚,這就像在龐大的數據集中尋找隱藏的洞見。
但是深度并非只與深海潛水有關。作為重要的概念,它在分析和機器智能領域也變得越來越重要。人工神經網絡,即模仿人類大腦建立的、處理單元(人工神經元)相互關聯的計算機模型,已經出現數十年了。早期,這些神經網絡通常有1個或2個隱藏神經元層組成,現在已經從淺層結構進化到深層結構,后者又被稱為深度學習。這種轉變依賴于大規模建造大型和并行模型的成本不斷下降,以及訓練深度模型所需大型多維數據集的日益增多。
但要想真正理解深度學習,你需要首先了解這三件事:
1.深度學習是機器學習分支
從本質上看,深度學習隸屬于機器學習范疇。但是標準的機器學習通常需要手工從數據中提煉模式,耗時費力。而深度學習模型擅長于自動捕獲隱藏于大數據中的復雜結構模式,在對圖像、視頻、音頻以及文本數據進行分析時,這種能力擁有巨大優勢,而依靠手工從數據中提取模式很快將達到極限。
2.深度學習不只是技術動力室
到目前為止,大量學術機構和科技公司都在研究深度學習,媒體對深度學習相關成果的報道也日益增多,這都大大促進了深度學習的普及?,F在,越來越多的公司正進入這個領域參加探索。有許多報道稱,數據科學家正將深度學習方法應用到更廣泛的行業分析領域,比如客戶流失預測、金融欺詐調查、產品推薦等,傳統企業對深度學習的興趣日益增加。
3.深度學習的利弊權衡
企業需要了解,進入深度分析領域需要權衡利弊。盡管深度網絡構架的精度可媲美甚至超越現有分析方式,但由此產生的模型通常是不透明的“黑盒子”,需要對其進行精調。深度學習往往需要預先架構投資,以便能處理模型的復雜性。大型神經網絡往往需要數小時乃至數天的訓練,如果沒有事先考慮或準備,這可能對數據科學團隊造成巨大影響。
為分析挑戰選擇正確的模型不僅僅是最大化模型精度的問題,它還受限于輸入數據集。當涉及到傳統分析時,模型的可解釋性和簡單性往往比精度要求更高。而要處理大數據集,建模方法的性能和可擴展性都需要被考慮到。依賴非操作性模型協助發現洞見的要求,與全面可操作性的建模構架完全不同。