中科創(chuàng)達孫力:AI賦能行業(yè)的難點與應(yīng)對方法
原創(chuàng)【51CTO.com原創(chuàng)稿件】當下,人工智能賦能安防、金融等細分領(lǐng)域,參與關(guān)鍵工作流程,提供多種多樣實用的服務(wù)。伴隨嵌入式領(lǐng)域的加速演進,人工智能被廣泛關(guān)注,作用于更多場景。中科創(chuàng)達立足智能終端操作系統(tǒng),聚焦嵌入式人工智能關(guān)鍵技術(shù)。近日,中科創(chuàng)達聯(lián)合清華大學、美國高通公司共同舉辦了“ThunderWorld2018嵌入式人工智能大會”,圍繞嵌入式人工智能領(lǐng)域的技術(shù)前沿、產(chǎn)業(yè)趨勢和熱點問題探討。
孫力·中科創(chuàng)達副總裁
主論壇上,中科創(chuàng)達副總裁孫力做了主題為《智能視覺的“深蹲”和“起跑”》的演講,闡述了建設(shè)圖像系統(tǒng)、普及3D圖像技術(shù)、優(yōu)化嵌入式AI算法應(yīng)用及AI賦能行業(yè)的難點與應(yīng)對方法展開。
建設(shè)圖像系統(tǒng)的難點與應(yīng)對方法
視覺技術(shù),是一門涉及諸多領(lǐng)域的交叉學科,用Camera進行圖像抓取是前提。抓取的過程錯綜復(fù)雜,涉及到模組進行圖像采集與應(yīng)用、主芯片功耗、性能和系統(tǒng)的優(yōu)化,及人臉識別、美顏、傳統(tǒng)拼接、光學處理、降噪等一系列算法。
做一個優(yōu)秀圖像系統(tǒng)除采集方面挑戰(zhàn),還有圖象處理算法,如曝光,白平衡,對焦,寬動態(tài)HDR,降噪等)、芯片加速、畫質(zhì)調(diào)優(yōu)等,還有硬件的碎片化須對畫質(zhì)進行復(fù)雜的調(diào)優(yōu)流程(實驗室和實際生活場景),還有慮功耗,性能和健壯性也是必須要考慮的。
孫力表示,畫質(zhì)調(diào)優(yōu)是圖像處理最重要的部分。想要產(chǎn)生***的圖像質(zhì)量,需要調(diào)試整個圖像的Pipeline、 3A(對焦,曝光,白平衡)等等很多細節(jié) 。
IQ – 畫質(zhì)調(diào)優(yōu)三大階段
畫質(zhì)調(diào)試,分為三大階段:
1. ***做好基礎(chǔ)軟件、驅(qū)動,像軟件功能檢查、無重大Bug影響IQ、驗證原始圖片(EXIF、AE參數(shù),校準數(shù)據(jù))等;
2. 配置相關(guān)專業(yè)設(shè)備,進行實驗室調(diào)參,像LSC、AWB、AE、Gamma、對比度增強、CCM、DPC、濾噪、邊緣增強等參數(shù)檢測及處理。
3. 真實場景調(diào)參,與參考設(shè)備對比拍攝并調(diào)整,參考設(shè)備像人物、寵物、風景、肖像、戶外、低光、辦公室、家庭、閃光燈、背光、電影等。
善用硬件加速,解決功耗和性能問題
硬件加速是提升圖像計算的關(guān)鍵部分,使用GPU、CPU等嵌入式硬件都需要具備多方面的能力。嵌入式硬件在對算法加速上有很大幫助,同時也會存在功耗的問題,建議類汽車多個攝像頭的拼接這樣的場景,擇優(yōu)選擇GPU。近幾年,汽車ADAS芯片對于高畫質(zhì)的要求發(fā)生了從外置的ISP到內(nèi)置ISP,到Bayer Sensor的轉(zhuǎn)變, 目前主流的方案是用外置的ISP,將來汽車領(lǐng)域也會經(jīng)歷類似于手機從功能機到智能機的演變。主要驅(qū)動力有BOM成本降低、如發(fā)熱問題,環(huán)視等應(yīng)用的拼接問題。像ASIL compatible、長期投入、Road testing嚴苛等是汽車特有的高門檻。
普及3D圖像技術(shù)的難點與應(yīng)對方法
利用3D圖像技術(shù)是圖像視覺方的另一個趨勢,普及過程中還需克服以下幾大難題:
- BOM成本,由于規(guī)模化的問題,還沒有降低到平民化。
- 種的光學設(shè)計,碎片化(ToF,結(jié)構(gòu)光,雙目,主動雙目等)。
- 嵌入式的SoC的depth map的運算能力(Pc輔助到嵌入式ARM based) 。
- 多套使用的完整建模問題。
- RGBD,基于3D的人工智能學術(shù)進展。
孫力表示,中科創(chuàng)達致力于利用寬動態(tài)/HDR 、降噪 、導(dǎo)入AI技術(shù)來解決傳統(tǒng)圖像質(zhì)量問題,經(jīng)過多年持續(xù)的投入與研發(fā),在視覺技術(shù)領(lǐng)域已經(jīng)有了很深厚的積累。
優(yōu)化嵌入式AI算法應(yīng)用的難點與應(yīng)對方法
AI正當時,嵌入式/邊緣AI是未來,嵌入式/邊緣端智能視覺設(shè)備量也在迅速增長。在此大背景下,中科創(chuàng)達推出一款基于高通驍龍 845 平臺的人工智能引擎,TurboX AI Kit。TurboX AI Kit主要特點有三:高性能的嵌入式端側(cè)/邊緣,AI 開發(fā)平臺;豐富的嵌入式 AI 開發(fā)、分析、優(yōu)化和調(diào)試工具;加速端側(cè) AI 的實現(xiàn)與普及,助力生態(tài)系統(tǒng)構(gòu)建;
當前制約嵌入式AI算法應(yīng)用的主要問題有:有限的計算資源、多樣化的應(yīng)用場景和需求、不成熟的生態(tài)系統(tǒng)、碎片化的終端處理平臺、性能(準確率-速度)的平衡/取舍、功耗與成本等。想要應(yīng)對這些問題,就需要在硬件和軟件深度結(jié)合、系統(tǒng)化設(shè)計等方面深究。
AI賦能行業(yè)的難點與應(yīng)對方法
當AI走出實驗室,賦能某個行業(yè),將面臨方方面面的挑戰(zhàn)。從客戶角度看,期望看到的是整體解決方案(數(shù)據(jù)獲取,隱私問題,訓練,生產(chǎn)管理系統(tǒng),私有云 部署,前后端等,而不是純算法)。
客戶在衡量AI技術(shù)的預(yù)算不是根據(jù)AI作為高大上的技術(shù)來做的,而是根據(jù)生產(chǎn)力提升(用戶體驗提升,銷售轉(zhuǎn)換率等),運行效率優(yōu)化,及經(jīng)營業(yè)績能承受的預(yù)算能力來反推的,這和目前昂貴的AI投入成本(人力,服務(wù)器等)是個矛盾。
當行業(yè)客戶的工作流程,部門職能等還未能圍繞先進生產(chǎn)力來進行部署和優(yōu)化時, 客戶期望一次性投入建設(shè)一個人工智能平臺,可以一勞永逸的自我訓練、升級和部署,對比于現(xiàn)在需要定制化的算法,未來圍繞需要解決的領(lǐng)域問題,少數(shù)的人力服務(wù)于算法的流程需要被建立。
那么,如何應(yīng)對AI賦能行業(yè)遇到的這些難點呢?AI需要一個平臺和引擎,而不是僅僅提供一個算法。舉例,下圖為中科創(chuàng)達智能視覺缺陷檢測方案效果圖。
中科創(chuàng)達智能視覺缺陷檢測方案效果圖
具體操作方式是通過傳統(tǒng)CV技術(shù)首先將復(fù)雜的背景濾除,讓缺陷在圖片上顯現(xiàn)出來,然后進行實際的分類。
未來,將有更多企業(yè)應(yīng)用AI,普及度不斷提升,隨著市場的逐漸擴大,應(yīng)用逐漸從特定領(lǐng)域向人們?nèi)粘I钌钊搿kS著智能化趨勢的不斷凸顯,智能視覺的應(yīng)用也將會進一步拓展和深化,逐漸向更多新興領(lǐng)域邁進,在智能機器人、自動駕駛、人臉識別、安防、醫(yī)療等領(lǐng)域的應(yīng)用將會越來越多。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】