大數據驅動創新再升級——解讀美國《聯邦大數據研發戰略計劃》

2016年5月,美國政府發布了《聯邦大數據研發戰略計劃》,以加速其2012年提出的“大數據研發行動”進程。本文對該計劃進行了解讀,供讀者參閱。
2016年5月23日,美國政府發布了《聯邦大數據研發戰略計劃》(The Federal Big Data Research and Development Strategic Plan,以下簡稱《計劃》),以加速其2012年提出的“大數據研發行動”進程。《計劃》旨在構建數據驅動戰略體系,基于大數據的分析、信息提取以及做出決策和發現的能力將激發聯邦機構和整個國家的新潛能,加速科學發現和創新進程,并培育21世紀下一代科學家和工程師,促進經濟增長。《計劃》由7大戰略組成,涉及15個聯邦機構,對各聯邦部門制定與大數據相關的計劃和投資提出了指導意見。
《計劃》是《大數據研發行動》的延續
美國政府將數據定義為“未來的新石油”,認為一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,21世紀數據將成為下一個大的戰略資源。政府機構的相關研究、公私伙伴關系以及未來數據科學家的教育和培訓,將大大促進數據的應用,促進經濟社會的發展,改善人們的生活質量,提高綜合國力。《計劃》是《大數據研發行動》的補充和完善。2012年3月29日美國政府發布全球***國家層面的大數據戰略——《大數據研發行動》(以下簡稱《行動》),大力推動和改善與大數據相關的收集、組織和分析工具及技術。《計劃》則是由7個平行的戰略組成,涵蓋了技術、可信數據、基礎設施、共享管理、隱私安全、人才培養和協作等與大數據研發相關的7個方面,通過比較可知,《計劃》是對《行動》的補充和完善(表1)。
表1 《行動》與《計劃》內容比較
《計劃》的特點
戰略意志,《計劃》的內容和布局體現了戰略性。美國大數據戰略得到政府科研管理體制和預算機制的支撐,《計劃》報告發布者為“網絡和信息技術研究開發計劃”(The Networking and Information Technology Research and Development(NITRD) Program)[注]。2011年,NITRD成立了大數據研發高級指導小組(Big Data SSG)。2012-2015年的4年間,Big Data SSG作為美國大數據戰略的“司令部”,在政策制定、執行和宣傳方面做了大量的工作。在與Big Data SSG近4年的年度戰略重點對比分析后,可以發現《計劃》所提及的5個戰略都是Big Data SSG的年度戰略重點(表2)。
表2 Big Data SSG近4年年度戰略重點與《計劃》的5個戰略比較

資料來源:作者整理
Big Data SSG未涉及的戰略4(共享管理)和戰略5(隱私安全)則與美國政府另外兩個政策——“開放數據”和“隱私保護”的研究有一定聯系(表3)。因此,《計劃》中的7大戰略都有據可循,逐漸融合成一個完整的有機體。
表3 戰略4和戰略5相關的政策文件

資料來源:作者整理
2015年,NITRD做出重大調整:在維持原有的8個項目組件領域(PCAs)的基礎上,經過整合和補充形成了10個新的項目組件領域。其中,新組建的大規模數據管理和分析(LSDMA),即由原來的Big Data SSG與人機交互和信息管理(HCI&M)領域中的信息化研究合并而成,總體負責聯邦大數據研發工作的協調和管理。
前瞻布局,不斷加大對基礎研究和前沿技術的研發投入力度。通過分析各機構的預算分配,可以發現政府協調下資源配置的實際傾向。NITRD***年度報告顯示,LSDMA領域的預算分配給了8個聯邦機構,總投入接近3億美元。其中,國防部先進研究項目局(DARPA)和國家科學基金(NSF)的預算金額占比***(表4)。
表4 聯邦各機構預算分配(LSDMA領域)

資料來源:作者整理
協同發展,重視跨機構協作,保證《計劃》的順利實施。隨著戰略布局的循序漸進,為避免《計劃》淪為一紙空文,聯邦政府在實踐中特別重視跨機構的協作。
一方面,各聯邦機構分別承擔相應的大數據項目。聯邦機構公開的大數據項目在一定程度上反映了戰略的實施情況。LSDMA列出了各聯邦機構大數據研發的部分項目,這些項目、涉及的機構以及對應的戰略(表5)。
表5 聯邦各機構的大數據項目及其對應的戰略

資料來源:作者整理
另一方面,聯邦機構積極開展與非政府機構的協作。從《計劃》的戰略7中,可以看到聯邦機構積極開展與非政府機構的協作。如NASA、NSF、DOE與Top Coder公司合作運營的一系列圍繞數據融合的思維挑戰賽;NASA與Amazon合作提供NASA地球數據交換平臺(NASA Earth Exchange)的訪問;國家海洋和大氣管理局(NOAA)與Amazon、IBM、開放云聯盟合作并向公眾發布所有的NOAA數據;DOE采用了全球協作模式對大型強子對撞機實驗和模擬數據進行共享和分析。

幾點啟示
美國大數據戰略布局早、投入大、涉及面廣,不僅在規劃內容上走在世界的前列,在布局及實施上更是領先全球。
注重通過構建數據驅動戰略體系,提高其國家及城市的競爭力。美國大數據戰略的首要目標是提高競爭力。基于此目標,《計劃》在頂層設計中不僅包含了提升計算能力及大數據技術和應用的創新戰略,還包含了提高數據可信度、加強基礎設施建設、開放數據、保護隱私、人才培養和跨機構協作等支撐性的內容。因此,美國大數據戰略的“野心”不僅僅局限于大數據科研本身,而是構建一個數據驅動戰略體系,將大數據研發作為“原料”,其他要素作為“催化劑”,以提高整個社會的“產出”,從而提高整個國家及城市的競爭力。
大數據戰略需要持續地跟進和不斷完善。《計劃》是對以往大數據相關政策的延續和完善。在正式政策發布之前,美國已經在數據科學領域進行了科研布局。在《行動》發布后,美國更是在大數據領域加速布局,分為三條路徑:一是科研創新和人才培養的政策路徑;二是政府數據開放的政策路徑;三是個人隱私保護和數據安全的政策路徑。這三條路徑最終匯聚到了***的《計劃》之中,形成一個全面且具有針對性的戰略。這種戰略的可持續性既保持了政策的穩定,又符合客觀發展規律,使美國有能力***大數據領域健康持續發展。
跨機構協作對大數據戰略的順利實施具有重要作用。聯邦政府大部分機構都有自己獨立的研發部門,協作可以讓分散在各部門的大數據研發資源得以優化配置,形成合力實現重大關鍵領域的突破;也可以使原本在各部門孤立的數據重新整合,發揮出真正大數據的價值;同時還能促進不同領域的跨界交叉,促使更多新思想和新方法的產生,創造出更多的創新項目。美國大數據戰略離不開政府頂層OSTP的戰略指導、NITRD的組織協調和OMB的預算審核,更重要的是這些機構本身就建立在跨機構協作的目標之上。
注:“網絡和信息技術研究開發計劃”(NITRD)是美國政府在1991年部署的一項具有國家戰略意義的研發計劃,提供了一套框架和機制來整合各聯邦部門資源以支持高級信息技術研發,并由項目組件領域(PCAs)和高級指導小組(SSGs)兩種類型的研究活動協調方式所組成(PCAs優先級高于SSGs,PCAs相當于 “重大工程”,SSGs相當于“試點”)。NITRD由總統行政辦公室EOP下屬的科學與技術政策辦公室OSTP管轄。
文章轉載自微信公眾號“三思派”(ID: Science-Pie)