"機(jī)"智過(guò)人與"技"不如人 觀察及思考
9 月 21 日,中央電視一臺(tái)"機(jī)智過(guò)人"節(jié)目播出關(guān)于杭州靈隱寺每天入園游客人數(shù)預(yù)測(cè)的人工智能與人工智慧的競(jìng)賽。競(jìng)賽的一方為"智慧大腦"的人工智能計(jì)算,另一方為靈隱寺管理人員的經(jīng)驗(yàn)判斷。結(jié)果是:1)按時(shí)間段(上午10點(diǎn)和下午 3點(diǎn)),人工智能的計(jì)算誤差太大,超過(guò)30%,而經(jīng)驗(yàn)判斷的誤差為 3%左右,因此被部分評(píng)委認(rèn)為是"技不如人";2)按一天(至下午6點(diǎn)閉園),人工智能的計(jì)算誤差小于5%,勝出(被評(píng)為"機(jī)智過(guò)人" )。
據(jù)介紹,該人工智能的計(jì)算算法是經(jīng)過(guò)交叉檢驗(yàn),其方法是在三年的入園游客的統(tǒng)計(jì)中,隨機(jī)去掉一天,并以計(jì)算數(shù)據(jù)插入,對(duì)比誤差應(yīng)小于 5%。而對(duì)于在競(jìng)賽中時(shí)間段上所出現(xiàn)的計(jì)算大誤差現(xiàn)象則被解釋為,是由于即時(shí)獲取入園游客的數(shù)據(jù)與計(jì)算算法在時(shí)間上存在偏差,屬于人為錯(cuò)誤。
然而,事實(shí)上,在對(duì)"人工智能"的研究和應(yīng)用中,類(lèi)似于"'機(jī)'智過(guò)人"之命題正是目前普遍存在的一個(gè)挑戰(zhàn)(或態(tài)勢(shì)與感知)。觀察及思考如下:
1)數(shù)據(jù)及其相關(guān)的關(guān)聯(lián)性
以靈隱寺的"機(jī)智過(guò)人"算法為例,其基礎(chǔ)數(shù)據(jù)來(lái)源于三年的每天入園游客數(shù)量統(tǒng)計(jì),應(yīng)是極為精準(zhǔn)。但是,數(shù)據(jù)的主要來(lái)源單一(門(mén)票銷(xiāo)售量),而每天入園游客數(shù)量必然受到當(dāng)時(shí)客觀條件和環(huán)境的影響,例如,天氣、突發(fā)事件或活動(dòng)、周一到周日的出行習(xí)慣等等。因此,門(mén)票銷(xiāo)售數(shù)量?jī)H僅是個(gè)基準(zhǔn)線(且可以近似為線性連續(xù)),而在三年間每天出現(xiàn)的客觀因素則是動(dòng)態(tài)的、離散的,且缺少參考數(shù)據(jù)以及可量化的分析,亦即數(shù)據(jù)分析一旦缺失對(duì)多維數(shù)據(jù)的關(guān)聯(lián),該算法是"脆弱"的,以至于難以避免計(jì)算結(jié)果出現(xiàn)(必然的)較大隨機(jī)誤差。
2)數(shù)據(jù)的預(yù)處理與檢驗(yàn)
一般而言,"人工智能"由三個(gè)部分組成:1)輸入,2)計(jì)算,3)輸出。其中,"計(jì)算"包括建模和算法;輸入的是量化數(shù)據(jù);輸出的是計(jì)算結(jié)果。
通常,任何算法都需要通過(guò)對(duì)輸入數(shù)據(jù)的循環(huán)學(xué)習(xí),不斷地深度優(yōu)化,力求所輸出結(jié)果的精準(zhǔn)或達(dá)到預(yù)期的參考效果。
因此,對(duì)輸入數(shù)據(jù)的預(yù)處理對(duì)算法存在直接影響;而對(duì)計(jì)算算法的檢驗(yàn)、判定計(jì)算算法輸出的置信度,也與輸入數(shù)據(jù)直接相關(guān),不可或缺。
顯然,對(duì)輸入數(shù)據(jù)的預(yù)處理至關(guān)重要,其要素包括(但不限于):
(1)數(shù)據(jù)來(lái)源的場(chǎng)景(環(huán)境)以及數(shù)據(jù)采集的方式(模式);
(2)數(shù)據(jù)的分類(lèi)、標(biāo)識(shí)以及定性和量化的表征;
(3)數(shù)據(jù)的常規(guī)、常態(tài)、涌現(xiàn)、隨機(jī)的特點(diǎn)特性特征的差分;
(4)數(shù)據(jù)的時(shí)序,以及相應(yīng)的回歸、歸納、溯源、甄別;
(5)數(shù)據(jù)的多元多源的相關(guān)性和關(guān)聯(lián)性。
因而,計(jì)算模型和算法應(yīng)提供其輸入數(shù)據(jù)特征及屬性調(diào)整和變化的接口,既保證算法復(fù)雜性的可收斂(如輸入數(shù)據(jù)的降維),又必須具備魯棒性和彈性。
3)數(shù)據(jù)預(yù)處理的問(wèn)題及挑戰(zhàn)
在大數(shù)據(jù)的環(huán)境中,必然存在著"已知"、"已知的未知"、"未知的未知"。例如,對(duì)靈隱寺的"機(jī)智過(guò)人"算法,已知三年中每天入園游客數(shù);已知的未知是三年中每天曾發(fā)生過(guò)什么客觀事件(外部的環(huán)境因素);未知的未知是這些客觀事件對(duì)入園游客數(shù)的影響程度、概率及其關(guān)聯(lián)性。
因而,挑戰(zhàn)是:如何發(fā)現(xiàn)"已知的未知";困難是:如何應(yīng)對(duì)"未知的未知";尤其是,當(dāng)預(yù)測(cè)預(yù)判未來(lái),如何假設(shè)"已知的未知"和"未知的未知"。
對(duì)此,深度的研究必須依賴于理論基礎(chǔ),當(dāng)且僅當(dāng)理論與具體實(shí)踐相結(jié)合,"人工智能"(或"智慧大腦")才能得以持續(xù)發(fā)展,緩解"慣性"使然。
"人工智能"是數(shù)字現(xiàn)代化的發(fā)展必然和應(yīng)用趨勢(shì),而且是一個(gè)通用的術(shù)語(yǔ)。但是,必須注意到,"人工智能"在不同的應(yīng)用場(chǎng)景具有不同的內(nèi)涵和目標(biāo)目的、方式方法、模式形式,以及不同的問(wèn)題和挑戰(zhàn)。例如:
谷歌的阿爾法圍棋(AlphaGo)是第一個(gè)擊敗人類(lèi)職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人,其主要工作原理是"深度學(xué)習(xí)"(從16萬(wàn)場(chǎng)人類(lèi)對(duì)弈的圍棋比賽中學(xué)習(xí)數(shù)百萬(wàn)棋譜),且至少存在三個(gè)顯著的特點(diǎn):
(1)邊界明確,即對(duì)弈的規(guī)則。雖然只有兩個(gè)非常簡(jiǎn)單的規(guī)則,而其復(fù)雜性卻是難以想象的,一共有 10170(10 的 170 次方)種可能性,沒(méi)有辦法窮舉出圍棋所有的可能結(jié)果。(觀點(diǎn):規(guī)則作為邊界,規(guī)則越簡(jiǎn)單,狀態(tài)復(fù)雜性越高。)
(2)沒(méi)有噪音。對(duì)弈的范圍清晰,棋盤(pán)上有縱橫各 19 條直線將棋盤(pán)分成 361 個(gè)交叉點(diǎn);黑白二色圓形棋子,勝者沒(méi)有直接明確的目標(biāo),完全是憑直覺(jué)。(觀點(diǎn):確定的和不確定的環(huán)境因素,都將直接影響目標(biāo)定位的復(fù)雜性。)
(3)贏在全局。幾乎沒(méi)有一個(gè)合適的評(píng)價(jià)函數(shù)來(lái)定義誰(shuí)是贏家,圍棋作為建設(shè)性的游戲,開(kāi)始的時(shí)候,棋盤(pán)是空的,慢慢的下棋雙方把棋盤(pán)填滿,每一個(gè)棋子都對(duì)棋局有著"牽一發(fā)而動(dòng)全身"的影響,而且必須評(píng)估未來(lái)可能會(huì)發(fā)生什么才能評(píng)估當(dāng)前局勢(shì)。(觀點(diǎn):事前是通過(guò)數(shù)值網(wǎng)絡(luò)的預(yù)測(cè);事后是通過(guò)決策網(wǎng)絡(luò)的歸納;事中是預(yù)測(cè)和歸納的綜合)。
由此可見(jiàn),對(duì)于"人工智能":人工智慧是充分條件(即算法是由人設(shè)計(jì)和操控,且理論是基礎(chǔ)),應(yīng)用場(chǎng)景是必要條件(即數(shù)據(jù)的采集、分類(lèi)及其關(guān)聯(lián))。