數字化轉型浪潮之下,買車也能靠算法優化?
原創近年來,汽車產業在數字化轉型浪潮的驅動下,不斷進行著穩步的轉型升級與業務重塑。而在此過程中,AI 算法的介入為汽車產業各業務線的經營效率提升與價值平衡起到了極大的幫助。在不久前由 51CTO 舉辦的【T·TALK】全年系列技術分享活動中,大搜車集團 AI 中心負責人 / 資深總監張揚老師就“AI 算法在汽車行業數字化轉型中的應用”話題進行了公開的直播分享,結合汽車行業自身特性,重點介紹了 AI 技術在多場景數字化中的應用以及基于 AI 算法的汽車行業業務優化案例。以下為本次分享的核心內容整理,希望能為讀者帶來一些收獲。
互聯網演進
1、從消費互聯到產業互聯
本次分享,主要想與大家聊一聊 AI 算法以及我在汽車行業和消費互聯網行業的一些工作實踐。在這其中,首先要介紹的是消費互聯網與產業互聯網的概念。
結合自身經驗來講,我從 2012 年開始負責搜狗輸入法的算法團隊,對于搜狗而言,更多的是涉足到消費互聯網上的,大家對消費互聯網都比較了解,包括衣食住行在內,每一個行業在目前也都有每一個行業的劇情。
從 2021 開始,我加入了搜車集團,投身到了產業互聯網行業。產業互聯網的核心其實同樣是應用 AI、云計算、大數據等技術,對行業上的一些經典應用場景進行賦能。從狹義角度看,產業互聯網主要涉及生產制造領域。而從廣義角度來講,產業除了生產制造外,還必須經過流通、交易、物流及倉儲,因此產業互聯網也并非完全局限于生產制造的領域。
2、數智化演進
互聯網的賦能技術,其中所涉及的方法很多都是相通的,包括 AI、大數據、云計算以及現在的區塊鏈和物聯網的一些技術。而這其中的趨勢,可以理解為信息化、數字化和智能化三個階段。
信息化,是一個形式上的變化和差異。數字化,更多的是商業模式包括應用方式的轉變。而在數字化的一個更高級階段,所經歷的則是廣泛的應用 AI 以及相關技術對數字化的提速。通過 AI 技術的賦能,如今各行業的數字化進程正呈現出指數加速的趨勢。
AI 賦能產業互聯網
1、典型應用場景
接下來,我將以汽車行業為例介紹產業互聯網的算法應用。選擇汽車行業作為具體案例的主要原因有兩個,第一是因為汽車行業的市場規模與市場空間比較大,目前中國已是全球規模最大的汽車消費市場,不管是新車還是二手車,都擁有著比較大的規模。
第二,在汽車行業里涉及到的商品數量是較少的,這使得技術更容易實現。以車型為例,品牌下有不同的車系,車系下有不同的車型,數目大概是六七萬的規模。當在進行 AI 實踐的時候,如果需要做知識圖譜的話,一個幾億規模的圖譜和一個幾萬規模的圖譜,其中的差異是很大的,會涉及到工作量以及重復勞動的問題,這會影響 AI 工作所能提供的技術高度。
在具體業務線的選擇上,本次會以二手車作為業務主線。目前,包括搜車在內的國內外頭部汽車行業企業,都是以二手車作為主業的,這其中也有著幾點重要的原因。首先,二手車是非標品。二手車作為一個商品去買賣的時候,是一車一況的,其使用情況、折舊情況都有所不同,這就會造成較大的議價空間,正因為有利益的驅使,所以做車輛流通的企業都傾向于二手車作為主業,不像廣告詞說的那樣,確實是需要有中間商賺差價的。
另外,目前中國的二手車交易是逐年增長的,并且有相關的政策扶持,國家也在促進二手車的應用和流通。
2、目標及需求分析
從 AI 從業者的角度來講,當我們在做汽車流通,尤其是二手車流通領域業務時,是會遇到一些困難和挑戰的。其中最主要的便是之前所提到過的一車一況,二手車的車況是難以判定的,但是當我們將二手車進行商品化時,需要去判定車況損耗的情況,比如剮蹭、掉漆、磨損,需要去界定它的狀態和價值,這樣才能完成對它的完全商品化。另外,對車輛相關證件的信息化錄入也是必不可少的。這些都是將二手車從一個線下實體變為線上可瀏覽頁面所需要做的工作。
其次,因為我們的主要工作是行業賦能,對于傳統 4S 店以及二手車商而言,它們的店面主要是存在于線下的。對于一些線上或線下的 C 端客戶而言,它們需要的是快速的匹配,但這其中難免會存在一些地域差異等影響因素。
最后,在二手車的售后過程中也很容易出現問題,如果顧客接手了事故車,那么顧客后續的使用包括安全方面是會存在很大隱患的,這里面也存在很多難以處置的問題。
而搜車所做的,則是為上述問題提供基于 AI 技術的行業解決方案,AI 解決的基礎可以理解為 ABC。A 代表 AI,B 代表大數據,C 代表云計算。搜車的側重點主要在交易和營銷領域,從一開始商品的上架,到交易的匹配,再到交易的金融方案與物流售后,每一個環節我們都會有相應的賦能。整體流程可分為前中后三個階段,其中的定損檢測和殘值預測是二手車特有的,去掉這兩個步驟,剩余的階段對于新車交易也是同樣適用的。
基于 AI 技術的優化方案
1、車況檢測優化
本次主要選擇整體流程中的車況檢測、殘值預測與匹配交易三個環節,與大家分享 AI 算法在其中的應用。首先,是車況檢測環節。做定損檢測分成五個環節,首先對于車輛的車證進行錄入,接下來檢測師會對車輛的外觀和內飾做拍照或錄制視頻,AI 算法則會自動識別視頻或者圖片里的車輛部件及瑕疵。隨后,檢測師將對所呈現的瑕疵進行核對及修改。在確認信息無誤后,檢測師會把數據傳輸到云端后臺進行審核。
在這個流程中要解決的核心問題,是要提升算法識別的精確度。而其中主要的困難,在于汽車部件與瑕疵類型的數目過多且難以區分。對此,所做出的提速和效果優化分成幾個維度,一般圖像識別的任務會用 CNN 去抽取基本特征,而后是基于 Transformer 的模型在圖像中進行應用,并使用 Transformer 的模型做了一些簡單的調整。另一方面,基于汽車的圖片,我們構建了一個汽車領域的預訓練的模型,并在流程上做了一些優化,使得一張圖里邊能夠識別盡可能多的缺陷,當然這里也有可能誤檢與漏檢,對此我們做了一些調整,使得我們后面的提速得到了比較明顯的體現。
2、殘值預測優化
其次是車輛殘值預測環節,這里的第一個困難是在于缺乏標準,二手車很難用一個很確切的方式去衡量。它的價格影響因素很多,有地域因素、車況因素、顏色因素,這是在品牌車型之外的一些需要去考量的目標。第二,在所使用的數據中,車輛要么作為零售賣出,要么就是批售賣出,不會同時存在零售價和批售價,因此會存在零售價和批售價倒掛的問題。
對于上述問題,首先需進行數據層面的優化,采用新車與二手車的零售價、批售價數據進行共同考慮。由于國產車與外國品牌車輛的銷售策略不同,因此新車的指導價與到手價會是二手車估價的一個重要影響因素。另一方面,是否有足夠的交易數據量支撐也是極為重要的一點。而在特征層面,則需要更加全面的特征考量,這其中包括車輛的車型信息、車齡、地域、顏色、過戶次數、里程數、車況、新車指導價、新車到手價等特征。其次是模型層面,這部分的差異化是比較小的,各企業都會利用深度學習模型或者樹模型。最后的接口層面,零售、批售對應的價格以及處置的周期,都是往經營分析上面去靠的。
3、匹配交易優化
最后一個環節,是車輛的匹配與交易,該環節存在的困難第一是車輛的購買,C 端是一個高消費但低頻的環節,用戶的決策周期是比較長的,而車商往往是聚集到線下的。因此,獲取采集它們信息并放到線上去做自動的匹配是比較困難的,并且這其中還存在一些地域的差異。對此的解決的方式是,通過集團內部資源的整合,盡可能讓交易能夠掛到線上,并綜合考慮物流,盡可能地解決其中的跨地域問題,包括對一些頂價策略、一些 bot 策略去做提升。這里的技術架構其實也是比較經典的,就是推薦系統的模型。
而為了更好的賦能匹配與交易環節,需要對傳統推薦系統進行優化,更多的考慮用戶的系統優化,并把用戶的推薦系統的系統目標與平臺的營收目標結合起來,基于 MMoE 模型進行整合。綜合的考慮用戶使用的滿意度以及平臺營收的滿意度。采用田忌賽馬的思想,在某些部分進行一定程度的舍棄,去降低某些客戶的需求,實現保證全局收益的最終目標。
總結與展望
無論是消費互聯網還是產業互聯網,其中都會應用到很多的 AI 技術。而我們要做的,是根據業務的需求和目標選擇合適的模型,以結果作為技術應用的最終導向,為業務目標的提升、用戶體驗的提升,去選擇最合適的技術手段。
并且在許多業務之中,一些人工的、規則的,包括一些統計的簡單模型,其實也是有著生存空間的,而且它們所發揮的作用有時會比我們所追求的高大上的算法還要大。最后,在技術的應用方面,希望大家能進行更多新的嘗試,這將會是很有意思的事情。
嘉賓介紹
張揚,大搜車集團 AI 中心負責人 / 資深總監。搜狗輸入法初創成員之一,歷任搜狗輸入法算法負責人,前平安人壽 AI Lab 語義問答產品負責人,現大搜車集團 AI 中心負責人、資深總監。發表及合作發表 ACL、EMNLP、IJCAI 等 CCF A/B 類國際 AI 會議論文 10 篇,國際及國內技術專利 28 項。
此外,更加值得關注的是,在今年的 4 月 9 日 -10 日,張揚老師還將以專題出品人及演講嘉賓的身份出席 WOT 全球技術創新大會,并在大會的“算法與 AI 應用”專題中為參會聽眾帶來更多 AI 技術細節層面的內容分享。對 AI 算法及產業數字化轉型感興趣的同學,這將是你不容錯過的學習與成長機會。
目前大會 8 折購票中,現在購票立減 1160 元,團購還有更多優惠!感興趣的同學可掃描下圖二維碼或點擊閱讀原文了解更多參會信息。任何大會相關問題歡迎聯系票務小姐姐秋秋:15600226809(電話同微信)