圖靈獎(jiǎng)得主Judea Pearl談:不能只靠數(shù)據(jù)
在當(dāng)前的人工智能研究社區(qū),以數(shù)據(jù)為中心的方法占據(jù)了絕對(duì)的主導(dǎo)地位,并且這類方法也確實(shí)成就非凡,為語音識(shí)別、計(jì)算機(jī)視覺和自然語言處理等重要任務(wù)都帶來了突破性的進(jìn)展。即便如此,也一直有研究者在思考這類方法的不足之處以及其它方法的重要價(jià)值。近日,圖靈獎(jiǎng)獲得者、著名計(jì)算機(jī)科學(xué)家和哲學(xué)家 Judea Pearl 發(fā)布了一篇短論文,從便利性、透明度、可解釋性三個(gè)角度談了他對(duì)激進(jìn)經(jīng)驗(yàn)主義和機(jī)器學(xué)習(xí)研究的思考。
論文鏈接:https://ftp.cs.ucla.edu/pub/stat_ser/r502.pdf
在這篇論文中,Judea Pearl 將沿便利性、透明度和可解釋性三個(gè)維度對(duì)比用于數(shù)據(jù)科學(xué)的「數(shù)據(jù)擬合(data fitting)」與「數(shù)據(jù)解釋(data interpreting)」方法。「數(shù)據(jù)擬合」方法的信念源自研究者相信理性決策就隱藏在數(shù)據(jù)本身之中。相較而言,數(shù)據(jù)解釋學(xué)派卻并不將數(shù)據(jù)視為唯一的知識(shí)來源,而是一種用于解讀現(xiàn)實(shí)的輔助手段——這里的「現(xiàn)實(shí)」是指生成數(shù)據(jù)的過程。文章將在因果邏輯的指引下,探討擬合與解釋在任務(wù)方面的共生關(guān)系,以此讓數(shù)據(jù)科學(xué)恢復(fù)平衡。
模擬進(jìn)化與數(shù)據(jù)科學(xué)
我最近參加了一個(gè)講座,演講者這樣總結(jié)了機(jī)器學(xué)習(xí)的哲學(xué)思想:「所有知識(shí)均源自所觀察到的數(shù)據(jù),有些直接來自感官經(jīng)驗(yàn),有些則來自通過文化或基因方式傳遞給我們的非直接經(jīng)驗(yàn)。」
觀眾會(huì)覺得這樣的稱述是不證自明的,其也為該演講奠定了基調(diào),即可以如何通過檢查數(shù)據(jù)中條件概率的模式來分析「知識(shí)」的本質(zhì)。很自然,它沒有涉及到「外部世界」、「理論」、「數(shù)據(jù)生成過程」、「因果」、「能動(dòng)性」和「心智構(gòu)造」等概念,因?yàn)閺谋砻嫔峡矗缬行枰@些概念也能在數(shù)據(jù)中找到。換句話說,不管人類在解釋數(shù)據(jù)時(shí)會(huì)用到什么概念,比如有關(guān)來源的文化、科學(xué)或基因上的概念,都可以追溯到讓這些概念有存在價(jià)值的初始感覺經(jīng)驗(yàn)并且還能從這些感官經(jīng)驗(yàn)重新推衍出來。
從人工智能的角度看,這種以數(shù)據(jù)為中心的哲學(xué)為機(jī)器學(xué)習(xí)研究提供了一種有吸引力的乃至極具誘惑力的研究前景:為了開發(fā)人類水平的智能機(jī)器,我們應(yīng)該僅遵循我們祖先獲得智能的方式,將我們可能收集到的所有數(shù)據(jù)用作輸入,在數(shù)字機(jī)器上同時(shí)模擬基因進(jìn)化和文化進(jìn)化。在極端情況下,這樣的前景可能激發(fā)出相當(dāng)未來主義和雄心勃勃的情形:從一個(gè)類似原始生物(比如變形蟲)的簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)開始,讓它與環(huán)境交互,變異并產(chǎn)生后代,給予其足夠的時(shí)間,它最終就能獲得愛因斯坦水平的智能。事實(shí)上,除了神圣的經(jīng)文和神明的啟示,如果沒有自古以來一直沖擊著人類種族的原始數(shù)據(jù)流(當(dāng)然也包括人類之前那些更原始的生物獲得的感官輸入),愛因斯坦又能從其它什么地方獲得他的知識(shí)、才能和智慧呢?
在問這樣的前景有多現(xiàn)實(shí)之前,我們先在討論之前看兩個(gè)觀察所知的情況:
1. 模擬進(jìn)化,不管是哪種具體形式,事實(shí)上都引領(lǐng)著當(dāng)前大多數(shù)機(jī)器學(xué)習(xí)研究的主要范式,尤其是那些涉及到連接主義、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的范式。這些技術(shù)可以部署無模型的、基于統(tǒng)計(jì)學(xué)的學(xué)習(xí)策略。這些策略在計(jì)算機(jī)視覺、語音識(shí)別和自動(dòng)駕駛汽車等應(yīng)用中已經(jīng)取得了亮眼的成功。這樣的成功激發(fā)了對(duì)這些策略的充分性和無限潛力的希望,同時(shí)也削弱了人們對(duì)基于模型的方法的興趣。
2. 以數(shù)據(jù)為中心的發(fā)展方向的思想根基深深根植于西方哲學(xué)的經(jīng)驗(yàn)主義分支。該哲學(xué)分支認(rèn)為:感官體驗(yàn)是我們所有概念和知識(shí)的最終來源,而「先天觀念」和「理性」在作為知識(shí)來源方面僅能發(fā)揮少許作用,乃至毫無作用。經(jīng)驗(yàn)主義思想可以追溯到古代亞里士多德的著作,但將經(jīng)驗(yàn)主義發(fā)揚(yáng)光大的則是英國經(jīng)驗(yàn)主義哲學(xué)家弗朗西斯 · 培根、約翰 · 洛克、喬治 · 貝克萊和大衛(wèi) · 休謨以及更近期的哲學(xué)家查爾斯 · 桑德斯 · 皮爾士(Charles Sanders Peirce)和威廉 · 詹姆斯(William James)。事實(shí)上,現(xiàn)代連接主義已被視為激進(jìn)經(jīng)驗(yàn)主義相對(duì)于理性主義的一大勝利。實(shí)際上,在數(shù)字機(jī)器上模擬知識(shí)習(xí)得過程的能力提供了非常靈活的測(cè)試平臺(tái),可讓人通過在數(shù)字機(jī)器上執(zhí)行實(shí)驗(yàn)來評(píng)估有關(guān)經(jīng)驗(yàn)主義和天賦能力(innateness)之間平衡的理論。
盡管測(cè)試哲學(xué)理論有其好處,但對(duì)于為機(jī)器學(xué)習(xí)研究遵循激進(jìn)經(jīng)驗(yàn)主義議程的思想,我有三個(gè)主要的保留意見。我將通過三個(gè)論點(diǎn)來說明為什么經(jīng)驗(yàn)主義應(yīng)該與基于模型的科學(xué)的原理保持平衡。而對(duì)于基于模型的科學(xué),學(xué)習(xí)過程受兩大信息來源指引:(a) 數(shù)據(jù),(b) 人工設(shè)計(jì)的有關(guān)數(shù)據(jù)生成方式的模型。
我將這三個(gè)論點(diǎn)標(biāo)記為:(1) 便利性、(2)透明度、(3)可解釋性。將在下文逐一討論它們:
便利性
進(jìn)化是一個(gè)過于緩慢的過程,因?yàn)榇蠖鄶?shù)突變都是無用乃至有害的,并且等待自然選擇區(qū)分并從無用突變中過濾出有用突變往往也具有難以承受的成本。大量機(jī)器學(xué)習(xí)任務(wù)都需要對(duì)稀疏的新數(shù)據(jù)進(jìn)行快速解讀并快速響應(yīng),而這些新數(shù)據(jù)又實(shí)在過于稀疏,以至于無法通過隨機(jī)突變來過濾。新冠疫情的爆發(fā)就是這一情況的完美例證:來自不可靠和各式各樣來源的稀疏數(shù)據(jù)需要快速解讀和快速行動(dòng),它們主要基于之前的流行病傳播和數(shù)據(jù)生成模型。總體而言,機(jī)器學(xué)習(xí)技術(shù)有望利用大量已經(jīng)存在的科學(xué)知識(shí),結(jié)合可以收集到的數(shù)據(jù),從而解決健康、教育、生態(tài)和經(jīng)濟(jì)等領(lǐng)域的關(guān)鍵社會(huì)問題。
更重要的是,科學(xué)知識(shí)可通過主動(dòng)引導(dǎo)數(shù)據(jù)和數(shù)據(jù)源的選擇或過濾過程來加快進(jìn)化速度。選擇使用哪些數(shù)據(jù)或運(yùn)行哪些實(shí)驗(yàn)前,需要從理論上假設(shè)性地考慮每種選擇會(huì)得到怎樣的結(jié)果以及它們?cè)谖磥硖嵘阅艿目赡苄浴Ee個(gè)例子,為了提供這樣的預(yù)期,可使用因果模型,其既能預(yù)測(cè)假設(shè)性操作的結(jié)果,也能預(yù)測(cè)違反事實(shí)情況地撤銷過去事件的后果。
透明度
為了最終能使用世界知識(shí)(即便是自原始數(shù)據(jù)自發(fā)演化而來的世界知識(shí)),我們必須以某種機(jī)器形式對(duì)其進(jìn)行編譯和表征。編譯知識(shí)的目的是將發(fā)現(xiàn)過程分?jǐn)偟皆S多推理任務(wù)上,從而無需重復(fù)這個(gè)過程。然后,編譯后的表征有助于高效地得到許多選擇性決策問題的答案,包括有關(guān)如何收集額外數(shù)據(jù)的方式的問題。某些表征允許這樣的推理,另一些則不允許。《為什么:關(guān)于因果關(guān)系的新科學(xué)》一書中提出的因果關(guān)系層級(jí)(adder of Causation)形式化地定義了用于回答有關(guān)假設(shè)性干預(yù)和 / 或解釋以及反事實(shí)的問題所需的知識(shí)內(nèi)容的類型。
知識(shí)編譯涉及到抽象和重新格式化。前者允許損失信息(正如圖像模型歸納為數(shù)值方程的情況),而后者會(huì)保留信息內(nèi)容,只是會(huì)將一些信息從隱式轉(zhuǎn)變成顯式的表征。舉一個(gè)經(jīng)典的例子:信號(hào)波形的頻譜表示。從信息角度看,前者等價(jià)于后者,但頻譜明確表示了信號(hào)的特定方面。
這些需要考慮之處要求我們研究所編譯的表征的數(shù)學(xué)性質(zhì)、它們的內(nèi)在局限性、它們支持的推理類型以及它們?cè)诘玫剿鼈兤谕玫降拇鸢干系男ЧS酶唧w的術(shù)語說,機(jī)器學(xué)習(xí)研究者也應(yīng)該參與現(xiàn)在被稱為「因果建模(causal modelling)」的研究,并使用因果科學(xué)的工具和原則來指導(dǎo)數(shù)據(jù)探索和數(shù)據(jù)解釋過程。
可解釋性
不管積累、發(fā)現(xiàn)或存儲(chǔ)因果知識(shí)的方式如何,由知識(shí)推動(dòng)實(shí)現(xiàn)的推理都要交付給人類用戶并讓其獲益。現(xiàn)如今,這些用途包括政策評(píng)估、個(gè)人決策、生成解釋、分配功勞和責(zé)罰或廣義地認(rèn)知我們周圍的世界。因此,所有推理都必須用一種與人們自身組織世界知識(shí)的方式相匹配的語言進(jìn)行描述,也即因果的語言。因此,不管機(jī)器學(xué)習(xí)研究者為數(shù)據(jù)擬合采用了怎樣的方法,他們都必須熟練掌握這種對(duì)用戶友好的語言、其語法、其普遍規(guī)則以及人們解讀或誤讀機(jī)器學(xué)習(xí)算法發(fā)現(xiàn)的功能的方式。
結(jié)論
將人類知識(shí)的內(nèi)容與其感官數(shù)據(jù)來源等同起來是錯(cuò)誤的。對(duì)于知識(shí)的特征描述而言,知識(shí)存儲(chǔ)于心智(或計(jì)算機(jī))中的格式及(尤其是)其隱式與顯式組分的平衡是與其內(nèi)容或來源一樣重要的。
盡管激進(jìn)經(jīng)驗(yàn)主義可能是進(jìn)化過程的一個(gè)有效模型,但它對(duì)機(jī)器學(xué)習(xí)研究而言卻是一個(gè)糟糕的策略。它讓以數(shù)據(jù)為中心的思潮大行其道,而這一思潮當(dāng)前主導(dǎo)了統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)文化。這一思潮認(rèn)為:理性決策的秘訣僅在于數(shù)據(jù)。
「數(shù)據(jù)擬合」和「數(shù)據(jù)解釋」平衡的混合策略能更好地讓我們把握進(jìn)化過程所需的知識(shí)編譯的各個(gè)階段。