"機(jī)"智過(guò)人與"技"不如人觀察及思考

作者：觀點(diǎn)參考 2019-09-24 14:18:34

9月21日，中央電視一臺(tái)"機(jī)智過(guò)人"節(jié)目播出關(guān)于杭州靈隱寺每天入園游客人數(shù)預(yù)測(cè)的人工智能與人工智慧的競(jìng)賽。競(jìng)賽的一方為"智慧大腦"的人工智能計(jì)算，另一方為靈隱寺管理人員的經(jīng)驗(yàn)判斷。結(jié)果是：1）按時(shí)間段（上午10點(diǎn)和下午 3點(diǎn)），人工智能的計(jì)算誤差太大，超過(guò)30%，而經(jīng)驗(yàn)判斷的誤差為 3%左右......

[[277716]]

9 月 21 日，中央電視一臺(tái)"機(jī)智過(guò)人"節(jié)目播出關(guān)于杭州靈隱寺每天入園游客人數(shù)預(yù)測(cè)的人工智能與人工智慧的競(jìng)賽。競(jìng)賽的一方為"智慧大腦"的人工智能計(jì)算，另一方為靈隱寺管理人員的經(jīng)驗(yàn)判斷。結(jié)果是：1)按時(shí)間段(上午10點(diǎn)和下午 3點(diǎn))，人工智能的計(jì)算誤差太大，超過(guò)30%，而經(jīng)驗(yàn)判斷的誤差為 3%左右，因此被部分評(píng)委認(rèn)為是"技不如人";2)按一天(至下午6點(diǎn)閉園)，人工智能的計(jì)算誤差小于5%，勝出(被評(píng)為"機(jī)智過(guò)人" )。

據(jù)介紹，該人工智能的計(jì)算算法是經(jīng)過(guò)交叉檢驗(yàn)，其方法是在三年的入園游客的統(tǒng)計(jì)中，隨機(jī)去掉一天，并以計(jì)算數(shù)據(jù)插入，對(duì)比誤差應(yīng)小于 5%。而對(duì)于在競(jìng)賽中時(shí)間段上所出現(xiàn)的計(jì)算大誤差現(xiàn)象則被解釋為，是由于即時(shí)獲取入園游客的數(shù)據(jù)與計(jì)算算法在時(shí)間上存在偏差，屬于人為錯(cuò)誤。

然而，事實(shí)上，在對(duì)"人工智能"的研究和應(yīng)用中，類(lèi)似于"'機(jī)'智過(guò)人"之命題正是目前普遍存在的一個(gè)挑戰(zhàn)(或態(tài)勢(shì)與感知)。觀察及思考如下：

1)數(shù)據(jù)及其相關(guān)的關(guān)聯(lián)性

以靈隱寺的"機(jī)智過(guò)人"算法為例，其基礎(chǔ)數(shù)據(jù)來(lái)源于三年的每天入園游客數(shù)量統(tǒng)計(jì)，應(yīng)是極為精準(zhǔn)。但是，數(shù)據(jù)的主要來(lái)源單一(門(mén)票銷(xiāo)售量)，而每天入園游客數(shù)量必然受到當(dāng)時(shí)客觀條件和環(huán)境的影響，例如，天氣、突發(fā)事件或活動(dòng)、周一到周日的出行習(xí)慣等等。因此，門(mén)票銷(xiāo)售數(shù)量?jī)H僅是個(gè)基準(zhǔn)線(且可以近似為線性連續(xù))，而在三年間每天出現(xiàn)的客觀因素則是動(dòng)態(tài)的、離散的，且缺少參考數(shù)據(jù)以及可量化的分析，亦即數(shù)據(jù)分析一旦缺失對(duì)多維數(shù)據(jù)的關(guān)聯(lián)，該算法是"脆弱"的，以至于難以避免計(jì)算結(jié)果出現(xiàn)(必然的)較大隨機(jī)誤差。

2)數(shù)據(jù)的預(yù)處理與檢驗(yàn)

一般而言，"人工智能"由三個(gè)部分組成：1)輸入，2)計(jì)算，3)輸出。其中，"計(jì)算"包括建模和算法;輸入的是量化數(shù)據(jù);輸出的是計(jì)算結(jié)果。

通常，任何算法都需要通過(guò)對(duì)輸入數(shù)據(jù)的循環(huán)學(xué)習(xí)，不斷地深度優(yōu)化，力求所輸出結(jié)果的精準(zhǔn)或達(dá)到預(yù)期的參考效果。

因此，對(duì)輸入數(shù)據(jù)的預(yù)處理對(duì)算法存在直接影響;而對(duì)計(jì)算算法的檢驗(yàn)、判定計(jì)算算法輸出的置信度，也與輸入數(shù)據(jù)直接相關(guān)，不可或缺。

顯然，對(duì)輸入數(shù)據(jù)的預(yù)處理至關(guān)重要，其要素包括(但不限于)：

(1)數(shù)據(jù)來(lái)源的場(chǎng)景(環(huán)境)以及數(shù)據(jù)采集的方式(模式);

(2)數(shù)據(jù)的分類(lèi)、標(biāo)識(shí)以及定性和量化的表征;

(3)數(shù)據(jù)的常規(guī)、常態(tài)、涌現(xiàn)、隨機(jī)的特點(diǎn)特性特征的差分;

(4)數(shù)據(jù)的時(shí)序，以及相應(yīng)的回歸、歸納、溯源、甄別;

(5)數(shù)據(jù)的多元多源的相關(guān)性和關(guān)聯(lián)性。

因而，計(jì)算模型和算法應(yīng)提供其輸入數(shù)據(jù)特征及屬性調(diào)整和變化的接口，既保證算法復(fù)雜性的可收斂(如輸入數(shù)據(jù)的降維)，又必須具備魯棒性和彈性。

3)數(shù)據(jù)預(yù)處理的問(wèn)題及挑戰(zhàn)

在大數(shù)據(jù)的環(huán)境中，必然存在著"已知"、"已知的未知"、"未知的未知"。例如，對(duì)靈隱寺的"機(jī)智過(guò)人"算法，已知三年中每天入園游客數(shù);已知的未知是三年中每天曾發(fā)生過(guò)什么客觀事件(外部的環(huán)境因素);未知的未知是這些客觀事件對(duì)入園游客數(shù)的影響程度、概率及其關(guān)聯(lián)性。

因而，挑戰(zhàn)是：如何發(fā)現(xiàn)"已知的未知";困難是：如何應(yīng)對(duì)"未知的未知";尤其是，當(dāng)預(yù)測(cè)預(yù)判未來(lái)，如何假設(shè)"已知的未知"和"未知的未知"。

對(duì)此，深度的研究必須依賴于理論基礎(chǔ)，當(dāng)且僅當(dāng)理論與具體實(shí)踐相結(jié)合，"人工智能"(或"智慧大腦")才能得以持續(xù)發(fā)展，緩解"慣性"使然。

"人工智能"是數(shù)字現(xiàn)代化的發(fā)展必然和應(yīng)用趨勢(shì)，而且是一個(gè)通用的術(shù)語(yǔ)。但是，必須注意到，"人工智能"在不同的應(yīng)用場(chǎng)景具有不同的內(nèi)涵和目標(biāo)目的、方式方法、模式形式，以及不同的問(wèn)題和挑戰(zhàn)。例如：

谷歌的阿爾法圍棋(AlphaGo)是第一個(gè)擊敗人類(lèi)職業(yè)圍棋選手、第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人，其主要工作原理是"深度學(xué)習(xí)"(從16萬(wàn)場(chǎng)人類(lèi)對(duì)弈的圍棋比賽中學(xué)習(xí)數(shù)百萬(wàn)棋譜)，且至少存在三個(gè)顯著的特點(diǎn)：

(1)邊界明確，即對(duì)弈的規(guī)則。雖然只有兩個(gè)非常簡(jiǎn)單的規(guī)則，而其復(fù)雜性卻是難以想象的，一共有 10170(10 的 170 次方)種可能性，沒(méi)有辦法窮舉出圍棋所有的可能結(jié)果。(觀點(diǎn)：規(guī)則作為邊界，規(guī)則越簡(jiǎn)單，狀態(tài)復(fù)雜性越高。)

(2)沒(méi)有噪音。對(duì)弈的范圍清晰，棋盤(pán)上有縱橫各 19 條直線將棋盤(pán)分成 361 個(gè)交叉點(diǎn);黑白二色圓形棋子，勝者沒(méi)有直接明確的目標(biāo)，完全是憑直覺(jué)。(觀點(diǎn)：確定的和不確定的環(huán)境因素，都將直接影響目標(biāo)定位的復(fù)雜性。)

(3)贏在全局。幾乎沒(méi)有一個(gè)合適的評(píng)價(jià)函數(shù)來(lái)定義誰(shuí)是贏家，圍棋作為建設(shè)性的游戲，開(kāi)始的時(shí)候，棋盤(pán)是空的，慢慢的下棋雙方把棋盤(pán)填滿，每一個(gè)棋子都對(duì)棋局有著"牽一發(fā)而動(dòng)全身"的影響，而且必須評(píng)估未來(lái)可能會(huì)發(fā)生什么才能評(píng)估當(dāng)前局勢(shì)。(觀點(diǎn)：事前是通過(guò)數(shù)值網(wǎng)絡(luò)的預(yù)測(cè);事后是通過(guò)決策網(wǎng)絡(luò)的歸納;事中是預(yù)測(cè)和歸納的綜合)。

由此可見(jiàn)，對(duì)于"人工智能"：人工智慧是充分條件(即算法是由人設(shè)計(jì)和操控，且理論是基礎(chǔ))，應(yīng)用場(chǎng)景是必要條件(即數(shù)據(jù)的采集、分類(lèi)及其關(guān)聯(lián))。

責(zé)任編輯：龐桂玉來(lái)源： CIO時(shí)代