?嘉賓 | 譚中意、祝世虎
整理 | 徐杰承
2022年對(duì)于人工智能而言注定是值得被銘記的一年,在這一年中,人工智能無(wú)論在技術(shù)還是產(chǎn)業(yè)層面都取得了巨大發(fā)展與長(zhǎng)足的進(jìn)步,大量創(chuàng)新技術(shù)從概念走向?qū)嵺`。年初,AI加持下的冬奧為我們帶來(lái)了煥然一新的觀賽體驗(yàn);年中,AI繪畫(huà)從虛幻走向現(xiàn)實(shí)并斬獲多項(xiàng)賽事大獎(jiǎng);年末,ChatGPT的橫空出世將再次將這一整年的狂歡推向高潮......
無(wú)論是底層技術(shù)的一次次突破,還是各類應(yīng)用的接連綻放,在過(guò)去的一年之中,人工智能向我們展示了它的無(wú)限可能。為了能更加全面地了解到人工智能領(lǐng)域的發(fā)展現(xiàn)狀與未來(lái)趨勢(shì),51CTO內(nèi)容中心特別邀請(qǐng)第四范式架構(gòu)師譚中意;光大信托信息技術(shù)部副總經(jīng)理祝世虎兩位業(yè)內(nèi)資深專家,共同探討了有關(guān)人工智能技術(shù)與產(chǎn)業(yè)的5個(gè)話題,希望能夠從中收獲更多答案。
1、2022人工智能領(lǐng)域的關(guān)鍵詞
譚中意:技術(shù)層面2022年最熱的關(guān)鍵詞無(wú)疑是“AIGC”,而在產(chǎn)業(yè)層面我想應(yīng)該是“AI 工程化”或者叫MLOps。因?yàn)槿缃駸o(wú)論是國(guó)內(nèi)還是國(guó)外,技術(shù)媒體、產(chǎn)品以及風(fēng)投領(lǐng)域?qū)τ贏I工程化的關(guān)注度都非常高。AI工程化和MLOps的核心理念就是讓機(jī)器學(xué)習(xí)在企業(yè)內(nèi)部更快地實(shí)現(xiàn)規(guī)模化落地,這也是過(guò)去一年人工智能相關(guān)產(chǎn)業(yè)所最關(guān)注的。
祝世虎:從政策角度看,2022年政府主導(dǎo)了數(shù)據(jù)要素的國(guó)家戰(zhàn)略,提出了數(shù)據(jù)要素是重組全球資源;重塑全球經(jīng)濟(jì)結(jié)構(gòu);改變競(jìng)爭(zhēng)格局的關(guān)鍵力量。目前中國(guó)的 IT 底層的標(biāo)準(zhǔn)、架構(gòu)、產(chǎn)品、生態(tài),大多是由國(guó)外的科技廠商決定的,因此存在諸多的底層技術(shù)、信息安全等問(wèn)題。所以隨著全球的 IT 生態(tài)由過(guò)去的單級(jí)向未來(lái)的多級(jí)方向去發(fā)展,我們需要建設(shè)自己的 IT 的底層框架。因此,在信創(chuàng)的背景下,我認(rèn)為2022年人工智能甚至是整個(gè)科技產(chǎn)業(yè)的關(guān)鍵詞應(yīng)該是“科技有國(guó)界”。
2、前沿人工智能領(lǐng)域技術(shù)發(fā)展與應(yīng)用現(xiàn)狀
譚中意:應(yīng)用層面,在AI工程化領(lǐng)域,第四范式在過(guò)去一年將大量自研技術(shù)積累進(jìn)行了對(duì)外開(kāi)源,其中包括線上線下一致性的生產(chǎn)級(jí)特征平臺(tái)OpenMLDB,能夠?qū)崿F(xiàn)對(duì)快速開(kāi)發(fā)企業(yè)內(nèi)部的實(shí)時(shí)預(yù)測(cè)、風(fēng)控與場(chǎng)景推薦,解決時(shí)序特征、高效讀取以及線上線下一致性問(wèn)題。開(kāi)源一年多以來(lái),與上下游的開(kāi)源技術(shù)生態(tài)形成了良好的合作,也取得了很好的成績(jī)。
在技術(shù)層面,第四范式始終堅(jiān)持AI方向的深耕,現(xiàn)階段主要專注于企業(yè)內(nèi)部?jī)煞NAI的落地。其一是感知類AI落地,例如CV、NLP。另一種則是決策類AI的落地,針對(duì)企業(yè)進(jìn)行策略制定,例如風(fēng)控、推薦、預(yù)測(cè)等此類與企業(yè)經(jīng)營(yíng)密切相關(guān)的場(chǎng)景。這一過(guò)程中比較重要的兩個(gè)關(guān)鍵點(diǎn),其一是將模型以較高的質(zhì)量進(jìn)行快速上線;其二則是對(duì)模型進(jìn)行持續(xù)的訓(xùn)練、反饋與調(diào)整,使模型始終保持其前沿性與高效性。
對(duì)于AI場(chǎng)景較多的企業(yè)而言,在這種情況下,一家企業(yè)中就能夠產(chǎn)生規(guī)模化的效益,實(shí)現(xiàn)從量變到質(zhì)變的躍遷,使企業(yè)從傳統(tǒng)的數(shù)據(jù)公司進(jìn)化為AI公司,達(dá)到通過(guò)AI提升核心競(jìng)爭(zhēng)力的目的。
祝世虎:近幾年金融行業(yè)對(duì)于人工智能技術(shù)的應(yīng)用已經(jīng)比較成熟了,過(guò)去一年包括未來(lái)幾年主要做的事情就是利用金融業(yè)務(wù)去引領(lǐng)金融科技的發(fā)展。例如在消費(fèi)金融領(lǐng)域,銀行在做消費(fèi)金融的準(zhǔn)入模型時(shí),第一代是規(guī)則驅(qū)動(dòng)的模型、第二代是規(guī)則 + 數(shù)據(jù)驅(qū)動(dòng)的模型,第三代則是大數(shù)據(jù)驅(qū)動(dòng)的模型。
而在現(xiàn)階段,智能算法要解決的一個(gè)核心問(wèn)題就是樣本不足。在實(shí)際做智能風(fēng)控的過(guò)程中,我總結(jié)一套手冊(cè)。例如當(dāng)數(shù)據(jù)的維度不足時(shí),第一種方式,可以使用新型特征組合方法AutoCross升維。第二種方式則是當(dāng)樣本不足時(shí),可以使用遷移學(xué)習(xí)。當(dāng)樣本的標(biāo)注成本較高的時(shí)候,很多樣本標(biāo)注沒(méi)有,可以使用Active learning的方法。當(dāng)樣本標(biāo)注錯(cuò)誤率偏高的時(shí)候,比如存在外來(lái)的一些數(shù)據(jù),它標(biāo)注的數(shù)據(jù)標(biāo)簽錯(cuò)誤率比較高,我們要用Confident Learning的算法。而在當(dāng)樣本的標(biāo)簽非常少時(shí),例如在用于交易反欺詐時(shí),這個(gè)時(shí)候可以選擇用半監(jiān)督學(xué)習(xí)的算法。這也是在過(guò)去一兩年內(nèi)總結(jié)出的相對(duì)成熟的應(yīng)對(duì)方案。
3、人工智能上下游產(chǎn)業(yè)市場(chǎng)環(huán)境的演化方向
譚中意:未來(lái)從事AI應(yīng)用的技術(shù)企業(yè),可能會(huì)分為三種。第一種是有資源做大模型,例如擁有海量數(shù)據(jù)、海量算力;擁有業(yè)界頂尖科學(xué)家的企業(yè),他們能做出精度很高且普適性較好的大模型,就像AutoAI,他們可能會(huì)以API的方式對(duì)外提供服務(wù)。
第二類則是具備豐富場(chǎng)景的企業(yè),針對(duì)各個(gè)場(chǎng)景,例如AIGC可以用在各種需要內(nèi)容的地方,來(lái)做出各種的應(yīng)用。
第三類則是介于兩者之間,更多的是提供工具,能夠幫助兩者做更好的連接,例如保證數(shù)據(jù)的準(zhǔn)確性、保證線上服務(wù)的穩(wěn)定和監(jiān)控、做模型的版本和Beta這類的企業(yè)。
從行業(yè)角度講,國(guó)內(nèi)目前AI落地主要集中在企業(yè)智能化轉(zhuǎn)型的相關(guān)行業(yè),目前最熱門(mén)的行業(yè)是金融行業(yè),有場(chǎng)景、有錢(qián)。幾乎是每一個(gè)AI技術(shù)企業(yè)必爭(zhēng)的行業(yè)。
第二種有前景的是新消費(fèi)、新零售。新消費(fèi)和新零售在目前的狀態(tài)下,很多企業(yè)、很多行業(yè)在不斷推出新品,新品的爆發(fā)速度是相當(dāng)快的,而且它們通過(guò)現(xiàn)在很多新媒體和新渠道的方式來(lái)做,對(duì)于營(yíng)銷(xiāo)、物流、供應(yīng)鏈方面有很多很多AI的需求。
第三種則是一些制造業(yè),目前重點(diǎn)都還在一些安全檢查、安全生產(chǎn)、故障檢測(cè)這種傳統(tǒng)的CV領(lǐng)域,CV領(lǐng)域也能夠提升一定的效率,但是還到不了能夠徹底改變行業(yè)工作模式的時(shí)候,徹底顛覆可能還需要幾年時(shí)間。
祝世虎:從一個(gè)AI從業(yè)者的職業(yè)變化中,我們就很容易了解到人工智能產(chǎn)業(yè)的變化趨勢(shì)。以個(gè)人為例,我最初從事的人工智能算法行業(yè),而后從算法轉(zhuǎn)做科技,再?gòu)目萍嫁D(zhuǎn)到了做數(shù)據(jù),現(xiàn)在又從做數(shù)據(jù)變成了做業(yè)務(wù),這其中實(shí)際上是有很深刻的邏輯的。
起初在做模型時(shí),我發(fā)現(xiàn)如果沒(méi)有科技去承載的話,模型只能嵌入到企業(yè)的風(fēng)險(xiǎn)管理中,它只能嵌入管理流程,并不能嵌入到具體的業(yè)務(wù)中,必須把模型嵌到科技系統(tǒng)中,才能下沉到具體的業(yè)務(wù)中,所以我從做模型到了做科技。
到了做科技之后,發(fā)現(xiàn)了第二個(gè)問(wèn)題,就是對(duì)模型和算法而言,數(shù)據(jù)對(duì)模型的貢獻(xiàn)度遠(yuǎn)遠(yuǎn)大于算法對(duì)模型的貢獻(xiàn)度,意識(shí)到數(shù)據(jù)的重要性后,又轉(zhuǎn)而用科技去做數(shù)據(jù)去了。做完數(shù)據(jù)之后,又轉(zhuǎn)去做業(yè)務(wù),這其中有兩個(gè)邏輯在里面。第一,模型是基于數(shù)據(jù)的,數(shù)據(jù)是基于統(tǒng)計(jì)的,統(tǒng)計(jì)是基于口徑的,口徑是業(yè)務(wù)部門(mén)定的。但是業(yè)務(wù)部門(mén)在制定業(yè)務(wù)口徑的時(shí)候,往往出于業(yè)務(wù)的需要,對(duì)業(yè)務(wù)口徑進(jìn)行戰(zhàn)略性的模糊處理。其次,大多數(shù)行業(yè)的數(shù)字化轉(zhuǎn)型,本質(zhì)還是業(yè)務(wù)去引領(lǐng)的,在產(chǎn)業(yè)發(fā)展這方面其實(shí)也是如此。
4、生成式AI的演進(jìn)路徑與可能的落地場(chǎng)景
譚中意:生成式AI近期得到了業(yè)界的廣泛關(guān)注,這的確是一件好事。AI領(lǐng)域這兩年來(lái),大模型的新場(chǎng)景其實(shí)是比較匱乏的。而如今ChatGPT之所以讓大家耳目一新是在于,真的讓用戶感覺(jué)它解決了很多之前多輪對(duì)話解決不了的問(wèn)題,而且也用大模型的方式生成出了一些比較切實(shí)的答案,給大家更多的信心。市場(chǎng)永遠(yuǎn)是需要技術(shù)熱點(diǎn)的,技術(shù)熱點(diǎn)的存在才能保持資本家的信心,而資本家的信心才能夠推動(dòng)他們掏錢(qián)把這些技術(shù)更快的落下去。
對(duì)于生成式AI的商業(yè)化落地,可能會(huì)分為三種。第一種,OpenAI這種有錢(qián)、有人、有算法,通過(guò)API就可以足夠的生成Revenue了。例如AutoCAD這家公司,它的Photoshop現(xiàn)在已經(jīng)集成了AIGC的部分功能,而另外幾家做AIGC的公司也產(chǎn)生了上千萬(wàn)的Revenue。這是少數(shù)幾家做大模型的公司能做出的事情。
第二類就是將AIGC的能力跟業(yè)務(wù)場(chǎng)景結(jié)合,業(yè)務(wù)集成商需要尋找很多業(yè)務(wù)的具體場(chǎng)景,然后再去思考成本、效率等問(wèn)題,需要很多的設(shè)計(jì),如果在剛需、利潤(rùn)、推廣三方面都能夠?qū)崿F(xiàn)進(jìn)步,才能形成很好的模式。
第三類模式也是OpenAI的CEO最近提到的,在這兩者之間還有第三類公司,能對(duì)普通的、普適的大模型做Finetune的技術(shù)提供商,它能針對(duì)一個(gè)具體的商業(yè)場(chǎng)景,然后對(duì)大模型進(jìn)行針對(duì)這種具體商業(yè)場(chǎng)景的Finetune,也能夠?qū)崿F(xiàn)商業(yè)落地。
回到根本,都還是需要解決商業(yè)或者解決用戶的實(shí)際問(wèn)題,而這是需要不斷地去摸索和嘗試的。我很高興看到AIGC的火,讓大家對(duì)AI的事業(yè)有更多的信心,也能讓更多的風(fēng)險(xiǎn)投資把錢(qián)投進(jìn)來(lái)。我覺(jué)得這都是好事。
祝世虎:同樣以O(shè)penAI的ChatGPT為例,它最吸引人的地方在于,每次和它進(jìn)行溝通,所收獲的內(nèi)容都不一樣,這也是它最有意思的地方。但從應(yīng)用的角度來(lái)看,這里存在著一個(gè)很?chē)?yán)重的問(wèn)題,當(dāng)用戶對(duì)這個(gè)系統(tǒng)每次輸入同樣的變量時(shí),它返回的變量是不可控的,這就意味著這個(gè)AI很難承擔(dān)責(zé)任。
以前包括現(xiàn)在,我們所使用的智能客服都令用戶感到非常傻,其語(yǔ)料都是事先設(shè)定好的。但恰恰是這種“傻”,才使得很多行業(yè)敢去使用智能客服,因?yàn)槠浞答伣o用戶的每一條信息都是受控的,它的每一句話都是公司能夠負(fù)責(zé)的。但是當(dāng)智能客服不可控時(shí),在實(shí)用中就會(huì)產(chǎn)生很多問(wèn)題。比如說(shuō)當(dāng)一個(gè)聯(lián)邦學(xué)習(xí)的公司來(lái)推薦聯(lián)邦學(xué)習(xí)算法時(shí),他會(huì)介紹這個(gè)算法能干什么,但對(duì)于很多行業(yè)而言,恰恰關(guān)注的是我把我的數(shù)據(jù)聯(lián)邦給你了,我的數(shù)據(jù)使用范圍一定要受控,它一定不能干某些事,我關(guān)注的是它不能干什么,而不是它能干什么。
同樣,對(duì)ChatGPT來(lái)說(shuō),我關(guān)注的是你的說(shuō)法一定要在我們能承受的范圍內(nèi),你的說(shuō)法一定要受我們的控制,你不能異想天開(kāi)的做一些你自己的發(fā)散的想法。但是作為技術(shù)上來(lái)講,很遺憾我們目前還無(wú)法實(shí)現(xiàn)這點(diǎn),太過(guò)于靈活、太聰明的AI能干出我們很多想不到且難以承擔(dān)后果的事,這是做技術(shù)和做產(chǎn)業(yè)不同的地方。
總的來(lái)說(shuō),技術(shù)的風(fēng)光和商業(yè)模式之間更多的是間接的關(guān)系,生成式AI現(xiàn)階段的確能夠幫我我們做一些創(chuàng)造性的工作,但這里的商業(yè)模式,目前我們還沒(méi)有完全跑通。而在需要更高精確度的工作中,生成式AI需要走的路還很遙遠(yuǎn)。
5、未來(lái)人工智能技術(shù)與行業(yè)的結(jié)合趨勢(shì)
譚中意:AI是一個(gè)算法,它與各個(gè)企業(yè)的結(jié)合是必然的,尤其是隨著各個(gè)企業(yè)做數(shù)字化、做智能化轉(zhuǎn)型的展開(kāi),AI+各種企業(yè) + 各種場(chǎng)景,也就是就是AI+everything,已經(jīng)呈現(xiàn)出了越來(lái)越快的趨勢(shì)。
未來(lái)幾年內(nèi)的killer app個(gè)人認(rèn)為會(huì)是自動(dòng)駕駛,自動(dòng)駕駛是AI集大成的應(yīng)用,它是能在極大程度方便人們出行的應(yīng)用,當(dāng)它和車(chē)、和路很好的結(jié)合,各種算法都能發(fā)揮很好的作用,同時(shí)又把這種規(guī)章制度完善起來(lái),未來(lái)五年內(nèi)能大批落地的、能讓大家耳目一新的killer app很可能會(huì)是L4甚至L5級(jí)別的自動(dòng)駕駛。
祝世虎:未來(lái)五年之內(nèi),證券、股票的自動(dòng)化交易將變得更加成熟,甚至于取代人類。在這個(gè)領(lǐng)域中機(jī)器取代人是一個(gè)非常明顯的趨勢(shì)。并且很值得關(guān)注的一點(diǎn)是,此前基于股價(jià)因子庫(kù)的算法正在被逐漸拋棄。AI未來(lái)在自動(dòng)化交易領(lǐng)域中面臨的最大的問(wèn)題不會(huì)再是股價(jià)的變化,而是AI1要和AI2成為交易對(duì)手,兩者之間將會(huì)是模型的對(duì)抗。
也就是學(xué)習(xí)你的對(duì)手會(huì)怎么處理這只股票,當(dāng)AI模擬得差不多時(shí),用戶就可以賺到錢(qián)了。所以說(shuō)AI算法未來(lái)會(huì)在自動(dòng)化交易的領(lǐng)域90%甚至99%取代人類,并且未來(lái)自動(dòng)化交易的算法將不再是現(xiàn)在常用的基于因子庫(kù)的模型,而會(huì)是借鑒博弈論模型對(duì)抗的一套理論。而人們要做的,只是選中目標(biāo)與策略,剩下的全權(quán)交給AI就夠了。?