燒錢圈地后,醫(yī)療大數(shù)據(jù)如何變現(xiàn)?
在我國,公立醫(yī)院掌握著醫(yī)療的核心數(shù)據(jù)。近年來, IT公司爭相競標(biāo)大型公立醫(yī)院信息平臺(tái)的搭建權(quán),用免費(fèi)、燒錢等策略跑馬圈地已經(jīng)成為各路玩家心照不宣的“行規(guī)”,企業(yè)看中的是潛藏在醫(yī)療數(shù)據(jù)中的巨大商業(yè)價(jià)值。如今,互聯(lián)網(wǎng)和信息技術(shù)已經(jīng)普遍覆蓋大型公立醫(yī)院,早在2004年,華東地區(qū)二級(jí)以上醫(yī)院的信息化建設(shè)覆蓋率就已經(jīng)達(dá)到90%以上。那么問題來了,“地”圈完了,錢燒完了,醫(yī)療數(shù)據(jù)又如何變現(xiàn)呢?互聯(lián)網(wǎng)和信息技術(shù)公司又如何扭虧為盈呢?
11月24-25日,由中國醫(yī)療器械行業(yè)協(xié)會(huì)智慧及移動(dòng)醫(yī)療分會(huì)、醫(yī)用軟件分會(huì)聯(lián)合主辦的“第三屆中國智慧健康醫(yī)療發(fā)展高峰論壇”在武漢召開。
北京大學(xué)人民醫(yī)院是國內(nèi)首家通過HIMSS7級(jí)的醫(yī)院。該院信息中心主任、醫(yī)學(xué)大數(shù)據(jù)研究中心副主任劉帆到場分享了他在醫(yī)療大數(shù)據(jù)應(yīng)用、價(jià)值挖掘和變現(xiàn)的一些心得體會(huì),貝殼社記者整理了全程干貨以饗讀者:
醫(yī)療數(shù)據(jù)的商業(yè)價(jià)值是挖掘出來的
近年來,不少醫(yī)院投入千萬甚至上億元成本,做信息化建設(shè)。但醫(yī)院是否思考過,醫(yī)療信息能用來做什么事?能利用的程度?用來做管理還是做決策?還是要降低成本?提高效率?僅僅是這么簡單嗎?
信息整合,是利用數(shù)據(jù)的第一步
過去,我們醫(yī)院的信息化建設(shè)就是由多家公司共同完成的,所以到了2011年到2012年,醫(yī)院的信息整合面臨嚴(yán)峻考驗(yàn),我們嘗試用平臺(tái)把所有信息整合在一起。
通過平臺(tái)實(shí)現(xiàn)資源、流程和數(shù)據(jù)的整合后,我們建立了三大數(shù)據(jù)中心,即前臺(tái)的臨床數(shù)據(jù)中心(CDR)、后臺(tái)的運(yùn)營管理系統(tǒng)(人力資源、財(cái)務(wù)、固定資產(chǎn)、物流采購庫存統(tǒng)一管理的系統(tǒng)),以及醫(yī)院的影像數(shù)據(jù)中心。
臨床數(shù)據(jù)中心(CDR)
醫(yī)生最需要臨床數(shù)據(jù)整合。特別是以病人為中心,以其患者索引號(hào)(EMPI)和時(shí)間軸主線,把所有的臨床數(shù)據(jù)做統(tǒng)一化、標(biāo)準(zhǔn)化、結(jié)構(gòu)化管理的CDR。
現(xiàn)在所有行業(yè)都可以用身份證來索引信息,但唯一在醫(yī)療行業(yè),還存在衛(wèi)生部的居民健康卡、人社部的社保卡、城市自己的城市居民健康卡、以及醫(yī)院自己的就診卡,造成病人的大量信息無法以唯一的識(shí)別號(hào)來索引。2014年,國務(wù)院提出要建立以身份證為索引的社會(huì)信用體系,唯獨(dú)醫(yī)療被排除在外。
因此,CDR最基本的問題是,如何把一個(gè)人全生命周期的健康醫(yī)療數(shù)據(jù)串聯(lián)在一起。2013年,北大人民醫(yī)院將患者的歷史臨床數(shù)據(jù)都遷移到CDR系統(tǒng)中,并做清洗處理。
醫(yī)院患者索引號(hào)(EMPI)的作用,就是把歷次門急診、體檢、住院中發(fā)生的檢查、診斷、治療等信息串聯(lián)在一起。這樣一來,以后產(chǎn)生的數(shù)據(jù)都是簡單化,且標(biāo)準(zhǔn)化的。現(xiàn)在醫(yī)院已經(jīng)存儲(chǔ)了大約471萬患者的數(shù)據(jù)。下圖是北大人民醫(yī)院CDR目前的使用情況:
影像中心
由于很多學(xué)科都以影像為支撐,醫(yī)院的影像系統(tǒng)非常復(fù)雜,包括心電圖、DSA(血管造影)、超聲、核醫(yī)學(xué)、病理,就連口腔和CT都有影像。所以,如何在醫(yī)院里如何以病人為中心,統(tǒng)一調(diào)度所有影像數(shù)據(jù),就是一個(gè)不小的挑戰(zhàn)。
2012年,醫(yī)院建立影像數(shù)據(jù)中心,在這個(gè)系統(tǒng)里,醫(yī)生可以調(diào)閱一個(gè)病人的所有的影像數(shù)據(jù)。平臺(tái)實(shí)現(xiàn)了統(tǒng)一管理、存儲(chǔ)、調(diào)閱和展現(xiàn)。

運(yùn)營數(shù)據(jù)中心
2008年起,北大人民醫(yī)院開始對(duì)所有后臺(tái)運(yùn)營的數(shù)據(jù)建立統(tǒng)一的管理系統(tǒng)。此后陸續(xù)建成了固定資產(chǎn)管理、物流采購管理、物流庫存管理、統(tǒng)一采購平臺(tái)、財(cái)務(wù)應(yīng)付管理、財(cái)務(wù)應(yīng)收管理、人力資源管理和外圍業(yè)務(wù)運(yùn)營系統(tǒng)等。
由于固定資產(chǎn)管理和藥品、低值和高值耗材的管理占了醫(yī)院流水的60%多,我們決定統(tǒng)一用物流管理平臺(tái)來管控;人力資源管理系統(tǒng)則主要管理薪酬、五險(xiǎn)一金、獎(jiǎng)金績效等;統(tǒng)一的B2B平臺(tái)則實(shí)現(xiàn)了對(duì)外自動(dòng)化的采購流程—— 無需人工,平臺(tái)自動(dòng)和供應(yīng)商進(jìn)行供應(yīng)鏈的整合。
運(yùn)營管理系統(tǒng)非常重要,是整個(gè)醫(yī)院后臺(tái)支撐的基石。
三大信息模塊數(shù)據(jù)的變現(xiàn)思路
我一直提倡要從需求端出發(fā)。醫(yī)生的科研需求大致可以分為八大類:風(fēng)險(xiǎn)預(yù)測模型、人群健康管理、藥物及器械安全型監(jiān)測、疾病及治療的異質(zhì)性分析、精準(zhǔn)醫(yī)療及臨床決策、醫(yī)療質(zhì)量及行為評(píng)估、公共健康和研究應(yīng)用。
目前,我們能夠看到的應(yīng)用主要有三件事:
- 用數(shù)據(jù)形成臨床流程和臨床指南
- 用智能科研平臺(tái)改進(jìn)醫(yī)學(xué)標(biāo)準(zhǔn)
- 用數(shù)據(jù)驅(qū)動(dòng)科學(xué)的醫(yī)院管理
大數(shù)據(jù)如何輔助科研?
要讓大數(shù)據(jù)真正服務(wù)于科研,必須要思考的問題是,如何把大量的臨床資料和臨床科研整合在一起,將數(shù)據(jù)轉(zhuǎn)化為解決臨床需求的知識(shí)。大數(shù)據(jù)科研平臺(tái)的核心功能,就是提供一個(gè)平臺(tái),運(yùn)用各種大數(shù)據(jù)技術(shù)和傳統(tǒng)的統(tǒng)計(jì)學(xué)方法等,為醫(yī)生和科研人員提供一個(gè)工具。
大數(shù)據(jù)帶來的真正意義是,通過歷史的數(shù)據(jù)發(fā)現(xiàn)新的規(guī)律,做沒有假設(shè)的研究。
科研、IT和數(shù)字科學(xué)三方合作的基本邏輯是:首先,也是最重要的一點(diǎn),醫(yī)生在長期的臨床工作實(shí)踐中,總結(jié)、思考后,提出科研問題和目標(biāo);第二,基于這個(gè)目標(biāo),醫(yī)生提出需要哪些數(shù)據(jù),并從所有數(shù)據(jù)中確定所需要的臨床條件;最后,技術(shù)人員根據(jù)這些需求把數(shù)據(jù)整理好,最終達(dá)到支持臨床研究的目的。
我們醫(yī)院曾經(jīng)有一個(gè)心內(nèi)科專家提出,想要做出心衰病人出院1年后再入院發(fā)生率的預(yù)測模型,了解其影響因素。因?yàn)樾乃ゲ∪嘶鶖?shù)大,且住院期間發(fā)生的費(fèi)用是其醫(yī)療總費(fèi)用的60%,從衛(wèi)生經(jīng)濟(jì)學(xué)角度上說,這個(gè)研究非常有意義—— 減少再入院率是減少醫(yī)療費(fèi)用的關(guān)鍵因素。
對(duì)于這個(gè)項(xiàng)目而言,第一件事就是確定研究對(duì)象。技術(shù)人員根據(jù)ICD診斷為心衰的指數(shù),篩選出了自2010年到2015年間的14985份疑似病歷,但I(xiàn)CD只能作為初選的納入標(biāo)準(zhǔn)。
確定真正的研究對(duì)象,要使用改良的Framingham心力衰竭診斷標(biāo)準(zhǔn)進(jìn)行復(fù)核。要從每份疑似病歷中提取癥狀、體征、診斷、病史、輔助檢查和治療等數(shù)據(jù),并通過數(shù)據(jù)分析把有差異的病歷都抽取出來。
評(píng)估下來,如果靠人來篩選的話,每份病歷需要耗費(fèi)半小時(shí),以每天連續(xù)工作10小時(shí)、無節(jié)假日計(jì)算,需2.05年的時(shí)間。這樣的投入成本讓研究看起來不可操作。
并且,已有的主客觀病歷數(shù)據(jù),都是非結(jié)構(gòu)化的,不可以直接被使用。
這種情況下,北大人民醫(yī)院的科研數(shù)據(jù)平臺(tái)nova就發(fā)揮作用了。
平臺(tái)首先做的就是做自然語言分析,其使用NLP(將非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理的一種分詞方法),將自然語言進(jìn)行全切分,比如將“他說的確實(shí)在理”這句話,切分為“他”、“說”、“的確”、“確實(shí)”“實(shí)在”、“在理”。
將院內(nèi)CDR(如醫(yī)院DB,HIS, LIS, DBn等),院外客觀數(shù)據(jù)(健康管理智能硬件、體檢、基因檢測、公共職能)和院外主觀數(shù)據(jù)(生活量表、隨訪等)等結(jié)構(gòu)化之后,nova就可以做一個(gè)數(shù)據(jù)處理層了,也就是把所有的數(shù)據(jù)打上標(biāo)簽,再用一系列的大數(shù)據(jù)技術(shù),把浩如煙海的原始的臨床數(shù)據(jù)變成可搜索的數(shù)據(jù)。
在此基礎(chǔ)之上,還有一個(gè)數(shù)據(jù)應(yīng)用平臺(tái),這個(gè)平臺(tái)上搭載了科研系統(tǒng)分析平臺(tái)、項(xiàng)目管理平臺(tái)(多中心管理、患者管理、疾病管理、隨訪管理系統(tǒng)、eCRF管理系統(tǒng))等,以這種方式給醫(yī)生提供科研工具。
Nova只花了1周左右的時(shí)間,就提取了心衰再入院及非再入院患者的特征變量,找到了研究所需的所有數(shù)據(jù)—— 一共納入1103例心衰患者,研究變量123個(gè),共135669個(gè)變量。
通過“隨機(jī)森林算法”,技術(shù)人員找到年齡、糖尿病、高脂血癥、缺血性腦血管病、慢性阻塞性肺病、舒張壓、血清白蛋白、血清鈉、Ln血膽固醇和出院帶β受體阻滯劑等10個(gè)可能影響患者未來再入院率的指標(biāo),然后做了一個(gè)比例風(fēng)險(xiǎn)的模型,把各個(gè)因素加權(quán)后變成一個(gè)公式。
最后回到臨床,這個(gè)公式在新進(jìn)病歷中得到了很好的驗(yàn)證。
截至今年7月底, nova上有科研統(tǒng)計(jì)需求101個(gè),涉及臨床科室35個(gè)(北大人民醫(yī)院臨床科室數(shù)44個(gè),占比80%),已有用戶數(shù)256人(北大人民醫(yī)院醫(yī)生數(shù)945人,占比達(dá)27.1%),7月單月,醫(yī)生查詢次數(shù)達(dá)到2718次。
我們做科研數(shù)據(jù)平臺(tái)nova有4個(gè)基本邏輯:
- 無論結(jié)構(gòu)化還是非結(jié)構(gòu)化,必須要先有數(shù)據(jù)。
- 數(shù)據(jù)需要整合。
- 技術(shù)永遠(yuǎn)不是最大的問題,技術(shù)只是一個(gè)支撐。
- 以應(yīng)用為導(dǎo)向。
實(shí)踐發(fā)現(xiàn),科研數(shù)據(jù)平臺(tái)能夠大大提高科研效率;不僅如此,平臺(tái)還革新了傳統(tǒng)的有假設(shè)驅(qū)動(dòng)的研究方法,創(chuàng)造了無假設(shè)的研究方式;最后,好的研究想法都是臨床中發(fā)掘出來的,科研工具用完之后還得回到臨床,完成PDCA的循環(huán)反饋過程。