圖像識別技術落地 探索多樣化應用場景
Alpha Go的勝利讓人工智能的“深度學習”概念迅速普及,而率先打破“機器學習”、過渡到“深度學習”的節點便發生在圖像識別領域。
根據平安證券的《通信行業人工智能圖像識別專題報告》,圖像識別分為生物識別、物體與場景識別和視頻識別。據估算,到2020年,生物識別技術市場規模將達到250億美元,5年內年均增速約14%。其中,人臉識別增速最快,將從2015年的9億美元增長到2020年的24億美元。
在各式的場景應用中,當下以人臉識別最為普遍,并且機器已經高于人類的識別能力。在兩周前的《***大腦》中,百度***科學家吳恩達帶著小度機器人和人類選手比拼,在人臉識別項目以3:2取勝。但是,在聯想和常識理解的能力上,圖像識別遠未能和人類比肩,相關公司正在積極切入垂直行業應用中。
圖像識別落地
圖像識別背后的技術就是新的機器學習方式,即深度學習。具體來說,在數據的基礎上,計算機自動生成特征量,而非人為設置特征量,然后計算機根據這些特征量來進行分類。
“相比2012年時的技術,這些年圖像識別再次突飛猛進,”數相科技CEO鄧立邦告訴21世紀經濟報道記者,“從技術角度來說,入門容易,從0做到40、60分相對門檻較低,要提升到90分就需要深厚的模型。”
圖像識別技術的迅速落地有多方面原因,一方面,很多大企業已經開源了基本工具,鄧立邦談道:“就人臉識別來說,有很多學術機構已經做了相當長時間的研究,發了很多論文,論文也已經接入到實際的應用中。但是人臉之外,例如情緒仍舊是比較難的話題。”
另一方面,產業鏈的更新迭代也為圖像技術打下基矗平安證券的報告中提到,高性能的AI 計算芯片、深度學習算法都是推動圖像識別發展的因素。其中,AI 底層架構從CPU+GPU 到FPGA,再到人工智能專用芯片,運行表現不斷刷新,目前英偉達的DGX-1芯片在程序運行速度上比舊版GPU 加速解決方案快12倍。
圖普科技方面也告訴記者,近年來,得益于計算機速度的提升、大規模集群技術的興起、GPU的應用以及眾多優化算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,深度學習才逐漸可用于工業化。
應用場景多樣化
盡管還未達到真正的人工智能,但日漸成熟的圖像識別技術已開始探索各類行業的應用。此前圖普科技CEO李明強就告訴記者,現在重要的是將人工智能切入到具體行業中,在垂直行業中獲取和管理大數據。
據悉,在農林行業,圖像識別技術已經得到應用。中國林產業協會非洲分會秘書長丁磊向21世紀經濟報道記者介紹道:“木材的生產包含多個環節,過去這些環節往往牽涉到大量的人力投入。如今,圖像識別已在多個環節中得到應用,例如森林調查,通過無人機對圖像進行采集,再通過圖像分析系統對森林樹種的覆蓋比例、林木的健康狀況進行分析,從而可以做出更科學的開采方案。而原木檢驗方面,圖像識別可以快速對木材的樹種、優劣、規格進行判斷,省去了大量人工參與的環節。”
平安證券在研究報告中舉例道,在金融領域,身份識別和智能支付將提高身份安全性與支付的效率和質量;在安防領域,未來在仍硬件鋪設到后端軟件管理平臺的建設轉型中,圖像識別系統將成為打造智慧城市的核心環節;在醫療領域,醫療影像基于人工智能的快速匹配可幫助醫生更快更準確的讀取病人的影像數據;在無人駕駛領域,低成本的攝像頭加視頻處理軟件方案將為無人駕駛商業化打下基矗
此外,智能家居、電商等行業中,圖像識別也有不同程度的應用。從目前的應用案例來看,以To B行業居多,當然不乏Face++等To C類產品。在深度學習之下,各公司面向不同行業,培育掌握不同知識的圖像識別機器。未來,如何在圖像的基礎上收集、處理大數據將成為行業內各玩家的另一個比拼點。