醫療健康大數據關鍵問題及對策研究
1.醫療健康大數據應用研究現狀和意義
在醫療衛生領域,我國對大數據技術的應用成熟度還不高。如何將傳統的醫療數據平滑過渡到大數據體系中,通過數據挖掘等手段對其進行專業的分析來實現數據的“增值”,是當下亟待解決的重要問題。能夠為精準臨床診療、決策支持、疾病監測預警與管理、公眾健康服務等領域提供有效的支撐,并能發揮區域衛生信息平臺上匯聚采集的數據價值。
2.醫療健康大數據分析需要解決的關鍵問題
本文的研究目的就是探討如何解決大數據分析關鍵問題,主要包括:醫療健康數據類型和結構復雜而多樣;從技術到業務有巨大的鴻溝:缺乏面向醫療健康領域的分析和挖掘算法庫、模型庫;缺少醫療健康知識庫支撐;大數據技術架構及工具選擇所面臨的挑戰:選擇一種架構并構建合適的大數據解決方案***挑戰,因為需要考慮非常多的因素;技術本身的挑戰:醫療健康語義知識庫構建,非結構數據的語義處理,傳統分析和挖掘技術的并行化,醫療健康標準化問題和數據質量問題;如何研究基于大數據的應用。
3. 醫療健康大數據分析對策
本文結合在上海市衛計委醫療大數據分析案例給出醫療健康大數據分析對策。
3.1 確定醫療健康大數據的業務研究主題
結合上海市衛計委目前信息化現狀,以及采集的數據范圍,確定醫療健康大數據的業務研究主題,包括:個性化健康管理:健康評估預警、健康自我管理、康復跟蹤、就醫輔助、健康處方制定、健康異常提醒;醫療衛生服務:醫療臨床輔助、臨床成本效益、智能診療方案分析、療效評估、臨床質量分析、醫療數據透明度;精準化衛生管理:醫療資源分配、管理績效分析、公眾健康監測、病人疾病經濟負擔、醫療服務定價、醫保控費;醫療科研:比較效果研究、疾病模式分析、合理用藥分析、傳染病預警、慢性病發病趨勢;企業大數據利用:新藥研究、藥物不良反應、醫療保險定價、健康管理服務。
3.2 醫療健康大數據技術架構
醫療健康大數據技術架構解決方案提供基于大數據的醫療健康智能服務。通過聚合數據、重構數據、挖掘數據價值,實現醫療健康領域的智能化服務。
3.3 醫療健康大數據的數據分類
醫療健康大數據根據數據的采集來源和業務分類可以分為:醫院醫療大數據:包括各種門急診記錄、住院記錄、影像記錄、實驗室記錄、用藥記錄、手術記錄、隨訪記錄和醫保數據等;區域服務平臺醫療健康大數據;疾病監測大數據:基于大量人群的醫學研究或者疾病監測的大數據;自我量化大數據:基于移動物聯網的個人身體體征和活動的自我量化數據,包含血壓、心跳、血糖、呼吸、睡眠、體育鍛煉等信息;互聯網及社交媒體數據:是指互聯網上與醫學相關的各種數據;生物大數據:主要是關于生物標本和基因測序的信息,直接關系到臨床的個性化診療及精準醫療;保險數據:醫保、新農合、健康保險數據等;外部數據:包括環境、氣象、地理數據等。
3.4 醫療健康大數據標準制定
上海市衛計委醫療衛生大數據平臺標準體系將在相關國際標準、國家標準、省市的區域衛生信息化建設中已發布的數據元、數據元值域代碼、醫療衛生術語、共享文檔規范等標準基礎上,結合業務特性建立業務的關聯性,建立業務邏輯模型,并落實到醫療健康大數據采集的相關數據接口中。從而建立醫療衛生大數據標準體系,包括醫療衛生大數據服務數據規范、醫療衛生大數據服務接入管理規范、醫療衛生大數據服務開放管理規范和醫療衛生大數據服務安全隱私規范。
3.5 醫療健康大數據治理策略
數據質量依賴于數據的應用,如何用大數據思維、新理念、新技術、新方法對采集到的數據進行梳理、整體分類。醫療健康數據的整合、存儲、挖掘和探索的基礎是數據治理。數據質量問題已經成為限制醫療衛生信息系統效能發揮的瓶頸和短板。數據質量涉及許多因素,包括準確性、完整性、一致性、時效性、可信性和可解釋性。為了提高數據時效性,任何數據都在醫務人員的實際工作過程中在其工作平臺軟件上錄入,業務軟件上采集的數據按照一定的規則和標準逐級匯總到衛計委/局的數據中心。
3.6 醫療健康大數據挖掘分析關鍵技術
醫療健康大數據挖掘分析的技術包括:計算、互聯和存儲;數據處理和管理;數據分析;可視化;應用和服務。
4.上海市衛計委糖尿病用藥推薦案例分析
確定大數據分析主題:研究影響醫生給糖尿病患者用藥的相關因素;數據預處理與特征提取:根據診斷編碼ICD-10篩選糖尿病人診療記錄,共472 460診療記錄,涉及516 340個病人;根據初篩的特征變量進行數據質量分析,判斷其實際可用性。通過兩輪篩選判別,最終選取可用變量38 項,最終形成糖尿病病人特征大表,共260萬條記錄;目標的模型構建與評估:將300多種藥品,按目錄通用名分為26類,利用隨機森林樹算法的多分類挖掘方法,給出28種藥品的使用概率,基于概率大小推薦Top藥品組合;最終優化結果:模型準確度為0.64,模型的精度為0.25。
5 結論
本文結合在上海市衛計委醫療健康大數據分析的項目案例,提出醫療健康大數據分析的關鍵問題,探索和總結了解決這些關鍵問題的對策。研究醫療健康大數據分析的方法、模型和算法,結合臨床、科研、藥品、公共衛生等領域的業務需求,能夠充分挖掘區域衛生信息平臺中積累的醫療健康大數據的應用價值。