院士談智能、模型VS數據AI、數字化轉型,這場AI盛會技術干貨來了
2022 年,院士如何看待未來人工智能的發展?未來AI是模型驅動還是數據驅動?當前AI開發的難題有哪些?
2月26日,在以“構建融通開放新生態”為主題的WAIC 2022上海人工智能開發者大會主論壇上,來自學界的院士大咖,產業界的技術專家,就這些問題展開了深刻的探討。
中國工程院院士、中國人工智能學會監事長蔣昌俊院士,南方科技大學副校長及講席教授、美國國家工程院院士張東曉發表了主旨演講。
在圓桌論壇上,來自學界、業界的多位代表就數字化轉型、AI開發難題等開發者關心的熱點話題展開了深入討論。
物質、信息和智能是我們在發展過程中非常重要的幾個標符。在這次的主旨演講中,中國工程院院士、中國人工智能學會監事長蔣昌俊首先回顧了16世紀以來人類在這三個方面進行的探索以及取得的主要成就,然后在此基礎上談了談他對于智能的思考。
蔣昌俊提到,當前人們對智能的認知局限于連續結構和離散結構,在此之外的結構形式還有待探索;深度學習算法從理論上來說沒有根本性的變化,還是基于神經層次結構,無非是處理的層次更多更廣;直到今天,智能世界還沒有在理論上形成一個公認的理論基礎。
“人除了可計算的思維,還有說不清的思維,比如說頓悟、靈感等等。”他認為,在這一輪的智能發展中,不可預測性、不確定性是需要重點考慮的AI基礎問題。
南方科技大學副校長及講席教授、美國國家工程院院士張東曉關于理論指導下的人工智能話題進行了分享。
模型驅動與數據驅動兩者在模式、映射關系等方面各有不同。在解決實際問題中,是選擇模型驅動還是數據驅動?
張東曉認為,數據在足夠多的情況下能夠以任何精度擬合任何函數,數據驅動可以實現很好的預測能力。
但是,僅依靠數據還不行。以深度學習神經網絡為例,其學習的模式架構可以將物理規律、工程控制、增加的經驗等信息綜合起來進行訓練,增強可解釋性和更好的穩健性,核心在于知識在深度學習框架中的嵌入。
張東曉表示,如何從數據中挖掘模型、得到知識是AI的最高境界。“在行業+AI的探索中,數據驅動與模型驅動的有機結合有助于解決實際行業問題。”
在探討數字化轉型的圓桌論壇中,上海科技大學副教務長、信息科學與技術學院副院長虞晶怡,賓通智能CEO龔超慧和燧原科技人工智能計算專家、產品市場部總經理高平分別發表了對元宇宙的看法。
「元宇宙首先要具備沉浸式的體驗,由于AI等技術的發展,我認為當前出現了新的機會。我們必須為此構建數據驅動的引擎。」虞晶怡說道。「除娛樂領域之外,元宇宙的應用方向還有很多,比如智慧城市的三維模型重建。最近谷歌和Waymo使用神經網絡的方法進行了舊金山大量街區的城市重建,其方法和傳統技術完全不同,可以快速渲染,將大型城市壓縮到很小的數據集中,但是它不可編輯。在智慧城市里面,元宇宙大有可為。」
「從現有技術手段來看,元宇宙概念就是使用一些圖象、視覺技術描述認知中的物理宇宙,希望通過其它技術手段重新呈現它。」龔超慧表示,「將來很有可能會出現全新的技術手段,能夠在虛擬和物理世界之間形成閉環和互動,我們可能會在這個世界里面創造全新的交互形式,進而帶來全新的商業模式和應用場景。」
「我認為元宇宙是數字經濟的一種新形態,需要強大的算力支撐。元宇宙進行的內容生產已經遠遠超過我們現在所理解的,基于視頻等媒介的互聯網內容基礎,未來我們需要海量的計算力支持虛擬環境渲染,產生的算力需求需要AI數據去加以支撐,」高平表示。「對于2B企業而言,可能會出現大量的,基于元宇宙2B底座,在這之上是開發者們構建的業務,人們將會各自去發揮才能,讓元宇宙產業生態枝繁葉茂。」
開發者是一個身份,有的開發者在高校從事算法研究,有的開發者在企業從事AI應用的開發,還有一些在跨界工作,開發者的職業是多重多樣的。在這場圓桌對話中,幾位嘉賓一起探討了2022年AI開發的難點。
首先談及AI算法研發相比于幾年前是變簡單了還是更難了,幾位嘉賓闡述了自己的觀點。
上海交通大學約翰·霍普克羅夫特計算機科學中心長聘教軌助理教授、博士生導師溫穎從生態發展的角度闡述了AI算法研發難度的變化。他說:2015年深度學習已經嶄露頭角,但當時還沒有一個完善的工具去做研究。2015年底TensorFlow首次發布,2016、2017年生態才逐漸成熟。如今大模型的驅動和新的算法讓模型的門檻變得更高了,需要很高的算力。
東方理工高等研究院助理教授陳云天則表示AI算法的研發變得更簡單了,一方面是因為出現了更多的框架,另一方面是當下良好的開源風氣讓計算機和其他學科的交叉領域有了更多進展。
上海人工智能實驗室通用視覺組計算機視覺研究員何逸楠也表示AI開發和幾年前相比,入門是更加容易了,并且有更多的開發者在社區中貢獻開源代碼,也有很多大廠開源的工具和平臺。開發者現在要做的就是提升自己的知識能力,解決更加上層的問題。
那么在基礎打好之后,現階段面臨的更高級別的挑戰有哪些呢?
何逸楠指出,當下首先要面對的挑戰是數據問題,訓練模型需要采集大量數據,其次還要提升訓練效率。
陳云天也表示,在小數據上做機器學習是一項挑戰,另外可解釋性和知識嵌入也是需要解決的難題。
溫穎則提到,強化學習雖然已在游戲方面取得了一些比較大的進展,但它在現實應用場景中還沒有完全體現出其作用,想嘗試把大模型用在強化學習中。