美國聯邦機構利用大數據的五個例子
在采用大數據策略方面,雖然私營部門發揮了模范帶頭作用,但公共部門也做出了不少成績。本文列舉了美國聯邦機構和地方政府機構制定和運用大數據策略的幾個例子,涵蓋欺詐檢測、金融市場分析、健康研究、政府監督、教育、犯罪學、環保和能源勘探等領域。
引言
本文是一組系列博客的第四篇文章。這組文章探討的是政府在實施大數據策略時所面臨的若干問題。第一篇文章解釋了數據的“大”為什么應該按照復雜性而不僅僅是體量來定義。第二篇和第三篇文章講述了大數據策略為公共機構擺出的四個挑戰。
以下是美國聯邦機構和非聯邦機構積極制定和運用大數據策略的幾個例子。希望這些例子能啟發大家利用自己手中的新一代分析工具探索各種可能性。
例1:大數據技術如何助力欺詐檢測和金融市場分析
●美國社會保障局(SSA)利用大數據策略來分析大量的非結構化傷殘索賠數據。SSA現在能夠更快、更高效地處理醫學分類和預期診斷,重塑整個決策過程,更好地識別可疑的不實索賠。
●美國聯邦住房管理局(FHA)在利用大數據分析來管理正向現金流基金方面擁有23年的經驗。在房地產泡沫破裂期間,FHA是唯一一家不需要救助的次貸保險機構。他們運用大數據分析來幫助預測違約率、償還率和索賠率。另外,他們還利用大數據技術為可能出現的場景構建現金流模型,以確定維持正向現金流所需的保費。
●美國證券交易委員會(SEC)運用大數據策略來監督金融市場活動。他們利用自然語言處理程序和網絡分析來幫助識別違規交易活動。
例2:大數據技術如何助力健康相關研究
●美國食品藥物管理局(FDA)在全國各地的很多測試相關實驗室里都部署了大數據技術,以便研究食源性疾病的模式。這套數據庫屬于該機構的技術轉讓項目,能讓FDA更快地對進入食品供應的受污染產品作出反應,這類產品在美國導致每年有32.5萬人因食源性疾病住院治療,3,000人死亡。
●美國國立衛生研究院(NIH)在2012年啟動了“從大數據到知識”(BD2K)計劃。BD2K是一項不僅限于該院的計劃,旨在使生物醫學研究成為一項數字研究事業,促進新知識的發現和運用,最大程度地提升社會參與度。從生物醫學大數據中獲取豐富信息的能力,將增進我們對人類健康和疾病的了解。然而,適當工具的匱乏、糟糕的數據可達性和培訓的不足妨礙了我們有效地整合研究力量。BD2K將幫助NIH應對這個挑戰。
●美國醫學研究所(IOM)和衛生及公共服務部(HHS)在2010年3月召集了一小群來自白宮、聯邦機構、學術界、社會部門、公共衛生團體、信息技術公司、大企業和醫療服務系統的領導者,商討新的社區健康數據計劃的建立事宜。2010年6月,IOM和HHS舉辦了“社區健康數據論壇:利用信息的力量來改善健康”。此次公共論壇的目的是進一步推動創新者對社區健康數據的使用,讓個人和社區都能為自身的健康做出明智的選擇。這些初始會議現在已經發展成為正式的全國性大會HealthDatapalooza,致力于開放健康數據,將企業、初創公司、學者、政府機構和個人聯合起來,通過對健康數據的開創性和有效利用,改善患者的健康狀況。
例3:大數據技術如何助力政府監督和教育
●通告和評論項目(Notice andComment project)使公眾可以方便快捷地查看400多萬份政府文件,包括《聯邦公報》(FederalRegister)發表的聯邦法規和地方政府發布的通告。該項目利用先進分析和自然語言處理來攝取政府文件,追蹤政策、法律和規章的變化。用戶可以輕而易舉地對擬訂中的聯邦法規進行評論或投票。網站數據每天都會更新,實時顯示新的提案和趨勢。在提案變成法律之前,用戶可以利用網站內部集成的社交媒體和網上的最佳寫作技巧來有效地宣揚他們的觀點,尋求其他人的支持。
●美國教育部利用大數據挖掘和學習分析來改善教學。美國教育部教育技術辦公室表示:“大數據分析能夠發現學習在線課程的學生是否走入誤區,并幫助他們調整方向。這些先進分析還有可能根據按鍵點擊模式判斷學生是否對當前課程感到無聊,然后重新獲取他們的注意力。由于這些數據是實時收集的,因此很有希望通過多個反饋回路實現持續改善。這些反饋回路的時間跨度不一——對學生來說是立刻思考下一個問題,對老師來說是每天安排第二天的教學,對校長來說是每月評估進展,對地方官員來說是每年評估總體的學校教育改善情況。”
例4:大數據技術如何助力打擊犯罪
●美國國土安全部(DHS)是證明公共部門需要大數據策略的好例子。該機構的組織形式突顯了在許多政府機構之間進行數據互通和整合的必要性。DHS不僅提供了很多如何進行有效整合的例子,也提供了很多如何更加成功地實現數據互通的經驗教訓。
●美國各地的州和地方執法部門在運用大數據策略方面有不少亮點。波士頓馬拉松爆炸案的偵辦就是很好的例子。大數據技術讓警方得以快速分析48萬多幅圖像。這些圖像即為非結構化數據。對嫌疑犯的詳細描述使分析人員可以撰寫代碼和算法,對圖像進行迅速分析,尋找異常情況和特定模式。從傳感器信息中自動篩查犯罪行為令實時分析得以實現,縮短了決策時間,減少了接觸敏感數據的人員或系統數量。
例5:大數據技術如何助力環保和能源勘探
●美國國家航空航天局(NASA)和美國林務局(U.S. Forest Service)幾年來一直在努力加強數據互通和研究合作,讓自己可以更準確地預測天氣、土壤狀況和森林火險。這項努力在數據要求和數據治理的協調方面事先下了很大功夫。除了先進的技術以外,還需要相關人員更好地理解問題和協調可用數據的使用,以制定出一套整體策略。
●深水地平線(Deep WaterHorizon)鉆井平臺漏油事故的應對措施就是依靠大數據互通來阻止原油泄漏,遏制污染物,對損害作出響應。私營部門和公共部門合作,在兩周內就完成了數據的整合,使各個工作組可以分析天氣、海洋和植物數據。大數據技術被用來預測哪些區域可能受到影響,并幫助確定應該向哪里派遣清理人員。
●美國國家大氣研究中心(NationalCenter for Atmospheric Research)制定了一套大數據策略,將公用事業單位、大學和能源業的研究和數據整合起來,以便更準確地預報天氣和預測能源的供應與需求。通過研究天氣和大氣模型,分析師可以讓可再生能源的生產和使用變得更加可靠和高效。他們把數據納入天氣實時分析模型,揭示能源生產和能源需求的重要信息。