人工智能應(yīng)用最大的問題是數(shù)據(jù)問題,而不是技術(shù)問題
隨著人工智能技術(shù)的發(fā)展,人工智能也從剛開始的聊天模型變成了能夠應(yīng)用到實(shí)際場(chǎng)景中的一項(xiàng)新的技術(shù);而且隨著國(guó)家大力發(fā)展人工智能技術(shù),人工智能就像二十年前的互聯(lián)網(wǎng)技術(shù)一樣,充斥著各種機(jī)會(huì),但同樣也面臨著各種各樣的挑戰(zhàn)。
但是,以個(gè)人從事一段時(shí)間的人工智能技術(shù)應(yīng)用,以及個(gè)人對(duì)人工智能技術(shù)的了解來看;人工智能目前在實(shí)際應(yīng)用中所存在的主要問題就是數(shù)據(jù)問題,而不僅僅只是技術(shù)問題。
當(dāng)然,人工智能技術(shù)還需要時(shí)間繼續(xù)發(fā)展,但以解決實(shí)際問題出發(fā),目前的人工智能模型需要大量的行業(yè)數(shù)據(jù)做支撐。
人工智能應(yīng)用所面臨的數(shù)據(jù)問題
為什么說目前人工智能的應(yīng)用主要是數(shù)據(jù)問題?
以目前大模型實(shí)際發(fā)展情況來看,chatGPT的出現(xiàn)使得大模型技術(shù)進(jìn)入了一個(gè)嶄新的時(shí)代;而經(jīng)過這兩三年的發(fā)展,大模型技術(shù)的范圍也越來越廣;比如視頻,圖片生成,自動(dòng)化工具等的出現(xiàn)。
隨著今年國(guó)內(nèi)大模型DeepSeek的爆火,其最大的優(yōu)點(diǎn)并不是解決了應(yīng)用問題,而是解決了模型的成本問題;其使得中小型企業(yè)也有可能訓(xùn)練和部署自己的專有模型。
但從24年開始,有人提出大模型不應(yīng)該僅僅停留在理論研究和技術(shù)迭代,還需要關(guān)注大模型解決實(shí)際問題的能力,也就是大模型的應(yīng)用場(chǎng)景。
但等到真正把大模型切入到具體的應(yīng)用場(chǎng)景中才發(fā)現(xiàn),現(xiàn)在市面上的模型很難去滿足具體行業(yè)或領(lǐng)域的業(yè)務(wù)需求。而僅僅只能用來搞一些創(chuàng)作類的工作,而且效果也不太好。
其中有一部分原因在于模型本身的問題,還有很大一部分原因就在于數(shù)據(jù)問題;數(shù)據(jù)是一切AI的基礎(chǔ),沒有數(shù)據(jù)AI技術(shù)就像空中樓閣。
舉個(gè)具體的例子來說,很多公司基于一些模型服務(wù)商做套殼,開發(fā)一些應(yīng)用;但實(shí)際操作中才發(fā)現(xiàn),哪些服務(wù)商提供的模型都是一些通用模型,無(wú)法解決具體領(lǐng)域的問題。
比如,使用文本生成模型做套殼的助手應(yīng)用,你問它大而泛大問題它可能回答的還不錯(cuò);但你要是問它具體領(lǐng)域的問題,它可能就傻眼了。比如你問它你們公司內(nèi)部的管理制度等,因?yàn)槿鄙傧鄳?yīng)的數(shù)據(jù),因此它就無(wú)能為力了。
以上的例子可能并不是很合適,但從技術(shù)的本質(zhì)出發(fā),技術(shù)只是技術(shù);它的本質(zhì)只是一個(gè)工具,與任何一個(gè)行業(yè)都是無(wú)關(guān)的;比如說互聯(lián)網(wǎng)技術(shù)即可以應(yīng)用于新興行業(yè),也可以應(yīng)用于傳統(tǒng)行業(yè)。
而人工智能技術(shù)也是如此,但要把技術(shù)應(yīng)用到具體的領(lǐng)域,這時(shí)就需要把技術(shù)和具體領(lǐng)域相結(jié)合;而這個(gè)結(jié)合的點(diǎn)就是數(shù)據(jù)。
互聯(lián)網(wǎng)行業(yè)有互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)特征,傳統(tǒng)工業(yè)有其獨(dú)特的數(shù)據(jù)特征;而這也是為什么很多企業(yè)選擇自己訓(xùn)練和微調(diào)模型,而不是直接把別人訓(xùn)練好的模型拿過來用;原因就是因?yàn)閿?shù)據(jù)對(duì)不上。
要想把人工智能技術(shù)應(yīng)用到某個(gè)行業(yè),那么就需要根據(jù)行業(yè)特性設(shè)計(jì)符合其特點(diǎn)的模型結(jié)構(gòu);以及使用大量的行業(yè)數(shù)據(jù)對(duì)模型進(jìn)行定制化訓(xùn)練。
數(shù)據(jù)是互聯(lián)網(wǎng)時(shí)代的石油,同樣也是人工智能時(shí)代的血液;所以,在以后越來越多的企業(yè)會(huì)選擇定制化模型來解決實(shí)際問題,而不是僅僅做套殼應(yīng)用。