使用UGC降低99.7%圖片識別成本 學(xué)霸君AI高考首戰(zhàn)告捷
134分!這是學(xué)霸君研發(fā)的高考機器人Aidam挑戰(zhàn)全國卷二文科數(shù)學(xué)卷取得 的成績,用時僅9分47秒。
150元!這是學(xué)霸君使用UCloud研發(fā)的通用計算服務(wù)(UGC)后,每月用于OCR圖片識別的計算資源成本。
學(xué)霸君自成立伊始,就一直非常重視深度學(xué)習(xí)技術(shù)等人工智能(AI)領(lǐng)域的研究,高考機器人就是成果之一。除了高考機器人,學(xué)霸君還在研究手寫識別技術(shù),并應(yīng)用于拍照搜題業(yè)務(wù),在圖片識別場景中,學(xué)霸君大量使用UCloud研發(fā)的UGC服務(wù),不僅輕松解決多個業(yè)務(wù)痛點,而且將成本降低至原來的千分之三。
學(xué)霸君的拓展藍圖
學(xué)霸君是一款面向?qū)W生的解題APP,提供在線免費解答作業(yè)題、疑難點等服務(wù)。比如,學(xué)生在寫作業(yè)時遇到不會做的題目,只需打開APP,將紙上的難題拍照并上傳,就能立刻獲取答案,同時還附帶完整的解題思路和步驟,實現(xiàn)“難題一拍,答案秒出”。
目前,宣布完成1億美元C輪融資的學(xué)霸君已經(jīng)練習(xí)了80萬套試卷,7000萬道題目,100億道學(xué)生搜題數(shù)據(jù),用戶月活躍量2000萬人次。
不過,學(xué)霸君的“雄心”不止于此。今年高考期間,學(xué)霸君研發(fā)出的高考機器人Aidam與高考狀元同臺PK,目的在于用高考機器人技術(shù)輔助師生教學(xué)。同時基于Aidam的技術(shù),學(xué)霸君將正式推出智慧教育平臺Ai學(xué),為學(xué)校的師生提供服務(wù)。
考試機器人是機器理解技術(shù)的一種典型應(yīng)用,也是AI領(lǐng)域的重要挑戰(zhàn)。學(xué)霸君創(chuàng)始人兼CEO張凱磊認(rèn)為,AI在教育領(lǐng)域擁有豐富的應(yīng)用場景,使機器判卷、個性化指導(dǎo)、個性化作業(yè)變成可能,老師和學(xué)生的學(xué)習(xí)效率都可以大幅度提升。
另外,學(xué)霸君還在研究手寫識別技術(shù),并應(yīng)用于拍照搜題業(yè)務(wù),進一步加強“讀圖識題”。
圖片識別場景痛點
在學(xué)霸君的解題應(yīng)用中,學(xué)生用戶將題目拍照并上傳到服務(wù)器,APP后臺程序從圖片文件中讀取文字、公式,再將圖片中的像素信息轉(zhuǎn)化成計算機程序能夠識別的數(shù)據(jù)類型。這一過程中,學(xué)霸君使用了OCR(光學(xué)字符識別)技術(shù)。
作為一款面向?qū)W生群體的產(chǎn)品,學(xué)霸君擁有海量用戶,因此后臺每天都需要同時處理大量圖片識別請求。此時,如果僅使用傳統(tǒng)的OCR技術(shù),將不可避免地遇到圖片識別慢、識圖率低等問題。這就要求學(xué)霸君團隊將OCR結(jié)合深度學(xué)習(xí)的識圖技術(shù)整合成服務(wù)端程序,以提高識別速度與效率。
在技術(shù)優(yōu)化之前,學(xué)霸君團隊曾面臨多個技術(shù)難題和困擾。首先,雖然識別圖片和搜索答案是學(xué)霸君的核心業(yè)務(wù),但為了應(yīng)付客戶端的海量請求和服務(wù)端程序性能優(yōu)化問題,無法將全部精力投入到最有價值的方向上。其次,隨著請求量日益增大,學(xué)霸君團隊需要及時做好資源預(yù)估,購置服務(wù)器資源并擴容;架構(gòu)上需要支持平行擴展,并且做好負(fù)載均衡與高可用容災(zāi),這都增加了架構(gòu)優(yōu)化和運維壓力。
另外,學(xué)霸君研發(fā)團隊在每臺圖片識別服務(wù)器啟動了與CPU核心數(shù)相同的Worker進程數(shù),為了保證并發(fā)量,每個識圖請求只能由一個CPU核心處理。為了應(yīng)對逐漸增加的識圖請求,學(xué)霸君前后共擴容了數(shù)十臺24核物理機用于部署圖片識別服務(wù)。然而,在實際日常運行中,很多物理服務(wù)器在每天業(yè)務(wù)低谷時段處于低負(fù)載狀態(tài),導(dǎo)致整體資源利用率低下,計算資源大量浪費。
UGC“對癥下藥”
為了解決這些技術(shù)痛點,學(xué)霸君選擇使用UCloud的通用計算服務(wù)(UGC)。通過評估UGC處理識圖請求的可行性,學(xué)霸君認(rèn)為UGC的產(chǎn)品特性能***解決之前遇到的難題。
作為UCloud研發(fā)的分布式大規(guī)模并行計算服務(wù),UGC(UCloud General Compute)是一款Serverless產(chǎn)品,以用戶算法代碼為中心,無需關(guān)心計算資源的交付部署,且計算資源服務(wù)化,用戶通過API使用計算資源。同時,UGC提供十萬核級的海量計算資源,輕松支持高并發(fā)計算任務(wù)請求,自動實現(xiàn)資源分配和擴展,具備高可用和跨可用區(qū)自動容災(zāi)能力。更重要的是,UGC實現(xiàn)按需付費(Pay As You Go),用戶只需要為實際消耗的計算資源付費。

學(xué)霸君研發(fā)團隊將圖片識別算法代碼打包提交到UGC算法倉庫中,通過調(diào)用UGC的API過程嵌入到自身中控程序代碼中。下一步,UGC平臺會立刻調(diào)用運行圖片識別算法,將識別后的數(shù)據(jù)實時返回到學(xué)霸君中控程序。如此一來,學(xué)霸君的算法工程師們不用再為如何實現(xiàn)優(yōu)化高性能服務(wù)器程序而費心,可以集中精力優(yōu)化OCR深度學(xué)習(xí)算法。
在學(xué)霸君APP業(yè)務(wù)流量高峰期,UGC能為增長的識圖請求自動擴展分配更多計算資源,輕松應(yīng)對高并發(fā)請求。這就徹底解決了學(xué)霸君的資源預(yù)估、服務(wù)器擴容、架構(gòu)伸縮平行擴展以及容災(zāi)設(shè)計等架構(gòu)難題。
根據(jù)UGC的“Pay As You Go”計費原則,學(xué)霸君只需要為執(zhí)行過圖片識別算法任務(wù)所消耗的CPU核時付費。在使用UGC之前,學(xué)霸君每月需要花費57000元物理機資源用于OCR圖片識別;UGC產(chǎn)品上線后,這一費用下降至每月150元,成本大幅降低99.7%,UGC為學(xué)霸君每年節(jié)省了近70萬元的物理機維護開銷。
學(xué)霸君圖片識別場景 使用UGC之前

學(xué)霸君圖片識別場景 使用UGC之后

“用戶的需求就是我們下一個產(chǎn)品”,UCloud始終致力于為用戶提供更好的產(chǎn)品與服務(wù)。通過使用UGC輕松解決用戶的圖片識別技術(shù)困擾,助力學(xué)霸君圓夢。