走出AI大模型“焦慮癥”,政企行業找到了“最優解”
自2022年底以來,隨著ChatGPT橫空出世并迭代升級,全球各國、各行各業面對AI大模型似乎都FOMO了(Fear of Missing Out,錯失恐懼癥),動作頻頻生怕錯失機遇。
然而迄今為止,在轟轟烈烈的“煉大模型”過程中,除了英偉達賺得盆滿缽滿外,其他玩家都還沒找到穩定且持續的商業模式。相反,隨著參數規模的日益膨脹,模型訓練的算力開支越來越高,大投入卻看不到產出的情況下,新的“焦慮癥”又蔓延開來。
在大模型“軍備競賽”最激烈的美國,資本市場近乎進入“癲狂”狀態。這兩年來,美股市場只要跟AI相關的股票都漲瘋了。蘋果一個AI進展發布會,隔天市值就上漲2142億美元;以微軟為首的美股“Big 7”的市值,更是達到史無前例的14萬億,占據標普500的32%,紙面市值與實際價值倒掛,“癲狂”程度史無前例。投行分析師們開始焦慮一個比互聯網泡沫更大的AI泡沫即將到來。
在中國互聯網圈,巨頭們焦慮與美國的差距的同時,開始不斷壓低每Token的價格,提前開啟簡單粗暴的價格戰。其中,字節跳動豆包大模型將通用模型pro-128k版的推理輸入價格定在0.005元/千tokens,較行業銳降95.8%;阿里通義千問將主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens,直降97%;百度甚至宣布將文心大模型的兩款主力模型ENIRE Speed和ENIRE Lite全面免費。
一方面是AGI的崇高理想,另一邊是ROI的殘酷現實,面對AI大模型這班開往未來的列車,不“上車”不行,“上車”后找不到好位置、堅持不到終點也不行,到底該何去何從?
在中國政企行業,一群富有遠見的先行者將通用大模型與特定行業的專業知識相結合,打造屬于自己的專屬大模型,以加速行業AI應用落地,真正兌現大模型的價值,為業界走出AI大模型“焦慮癥”找到了“最優解”!
中國大模型擺脫“焦慮癥”,破局之路在行業
從全球“大模型之爭”開啟之初,“中美在AI領域差距有多大”就一直都是公眾關注的熱點議題,從1~2年到8~10年不等。
必須承認,我國在算力、算法和數據領域其實并不具備優勢:高端算力卡被英偉達卡脖子無法供應,短時間內自有制程和設計又無法跟上;算法領域,雖然模型數量眾多,但大多數是基于國外開源架構優化,缺乏自主性和領先性;數據領域,我們的開放數據和國外不在一個數量級上,中文語料嚴重不足。
這些差距是短期內難以抹平的,這時候,縮短差距的正確打開方式,自然不是以己之短博人之長。
從另一個角度看,我國有全球唯一的全工業門類、最多的金融消費人群以及最大規模的政務和城市體系,產生了豐富的場景和私有數據,這些都成為發展行業大模型的天然土壤。因此,比拼應用成為中國大模型破局的一條有效路徑,通過大模型賦能一個個行業細分場景,最終形成戰略突圍。
以差異化優勢入局,可以預見,今天率先擁抱大模型的行業企業和組織,面對的將是一個劃時代的重大戰略機遇。
政企行業大模型挑戰重重,工程化能力是“勝負手”
當然,站在新時代的起點,政企行業打造大模型,依然是挑戰重重,因為大模型的應用本身就是一個復雜的系統工程,除了單點技術的持續突破外,更需要基于場景和需求匹配合適的技術,通過全鏈路、多技術融合的系統性創新整體推進。
首先,大模型不是孤立的技術,必須重視軟硬件基礎設施的協同發展。除了大模型本身,我們還需要關注其背后的技術生態系統,包括開發工具、計算架構以及硬件設施如算力、存儲和網絡。在設計和驗證過程中,必須考慮性能、可靠性、可維護性和兼容性,確保系統的高效和穩定運行。
第二,行業大模型需要AI-Native的基礎設施。一般企業可以直接選擇公有云享受云上的充沛算力,但對于政府、金融、電力等大型政企而言,為了滿足安全合規要求,混合云才是更優選,即先借公有云的超大算力和數據訓練基礎大模型,再在私有云里結合私有數據二次訓練得到企業專屬大模型,最后在邊緣云推理實現場景化應用。
第三,大模型需要建立AI開發工作流,促進模型確定性交付。大模型的開發是一個復雜的系統工程,需要跨團隊協作和迭代開發。為了提高開發效率和質量,需要建立一站式的AI開發工作流,實現標準化和自動化,減少開發過程中的不確定性。
第四,大模型需要重視數據工程,打造優質數據集。高質量的數據是大模型成功的關鍵。目前中文數據集與英文存在差距,需要通過建立數據工程能力,優化數據的供應、流動和使用,為大模型高質量供數。
第五,行業大模型不適合孤軍作戰,需要著力培育產業生態。生態是發展大模型不可或缺的一環,這需要政府和行業頭部企業從技術生態、數據生態、模型生態和應用生態四個層面,去構建AI時代開放、可閉環、有質量的生態體系。
最后,大模型不是一錘子買賣,需要持續運營與優化。大模型運營和建設同樣重要,持續的運營和優化對于大模型平臺的長期價值至關重要,這要求企業建立適合的流程、組織結構和人才隊伍,不斷優化現有場景并探索新的應用領域。
一言以蔽之,行業大模型考驗的不是單項能力,而是全流程融會貫通的工程化能力。
先行者邁出堅實步伐,行業大模型未來可期
綜上不難看出,盡管當前大模型在技術和價格上卷得如火如荼,但其兌現價值的“主航道”在行業,真正的賽點在于落地。在行業大模型的大賽道上,不盲目追求堆算力、堆參數量,而是聚焦技術與場景的深度融合,踏踏實實積累工程化能力,幫助行業大模型落地才是關鍵。從這個層面講,AI for industries的華為云與政企行業先行者的聯合創新實踐,可謂走在了正確的道路上。
去年,華為云就率先發布業界首個大模型混合云華為云Stack。在近期的華為開發者大會上,華為云更進一步發布大模型混合云十大創新技術,包括多樣性算力調度、算子加速、云邊協同等等。既有根技術研發實力,又有業界最全的AI大模型全套工具鏈和軟硬件產品,華為云Stack一套組合拳下來,行業大模型的焦慮也被治好了大半。
比如,從2022年開始,山東能源集團攜手華為云基于混合云打造全球首個礦山大模型,已在煤礦領域9個專業40多個場景應用實踐。今年1月,鄂爾多斯與華為聯合打造內蒙古首個以行業AI大模型為核心的工業互聯網平臺,在煤礦領域提升、主運、安監、防沖、采煤、掘進、輔運、洗選、焦化等9個專業實現了26個場景智能化,達到可視、可管、可溯規范化作業,提升安全生產能力的同時有效提高了生產效率和效益。
更值得注意的是,先行政企的行業大模型不僅是自建自用,更是在牽頭打造示范場景并沉淀經驗,對外輸出向行業賦能。比如,鄂爾多斯工業互聯網平臺目前已完成44個AI大模型應用開發,上架270多款商品,為28家AI企業、16家礦鴻企業共44家應用開發者以及當地300多家礦山生產企業提供了開放可靠的交易平臺。
展望未來,相信在華為云及產業上下游各方的共同努力下,依托我國場景豐富的優勢,大模型必將能夠打開更廣闊的行業智能化天地,加速邁向智能世界,釋放更大的經濟和社會效益!