大數據挖出抑郁微博 靠譜嗎

在微博上經常抱怨“去死”,或許會被甄別為抑郁患者。近期,一項“利用社交媒體數據挖掘識別抑郁傾向人群”的研究成果在網絡引發熱議,來自哈爾濱工業大學的研究人員稱,通過構建抑郁傾向識別模型,實驗室在新浪微博近億用戶中識別出幾百名重度抑郁癥患者,研究結果經醫學機構確認準確度可達83%。相關人士表示,這項研究結果或成為抑郁癥臨床診斷之外的新興診斷方法。
建構預測模型在新浪過億用戶中掃描
該項研究由哈工大“社會網絡與數據挖掘”聯合實驗室與國內社交媒體數據挖掘公司“宏博知微”共同開展。實驗室負責人哈工大博士于霄告訴南都記者,他是在微博上幾位抑郁癥患者自殺事件發生后開始關注抑郁癥患者這一群體的,“仔細看這些人的微博,非常觸目驚心,負面情緒在每一條都很明顯,當時我們就感嘆,如果通過數據識別這一群體,讓其親友能早點干預,也許可以避免悲劇發生。”
如何識別抑郁群體?于霄和同事首先是挑選新浪微博用戶中被確認為抑郁癥的人群作為樣本,通過計算機強大的計算能力分析樣本數據,從這些數據獲取出規律后建構預測模型。有了數據模型,計算機就可以用這一模型掃描新浪微博上過億用戶了。
“計算機算法會包括自然語言處理、時間序列、機器學習等,比如失眠在抑郁癥患者中比例非常高,會成為語言處理的關鍵詞,機器還會對關鍵詞出現的頻率和時間段打分。”于霄說道。
約200用戶被人工判定為抑郁患者
計算機最終統計的數據比他們想象中要更為豐富:存在抑郁傾向的微博用戶與普通用戶發博時間有明顯差異,這部分人群發博高峰在23點,其夜間活躍度比普通用戶平均約高出30%。該群體微博關鍵詞為:死、抑郁癥、生命、痛苦、自殺。有60%為女性,40%為男性,女性比例比男性略高,也與之前兩位女性微博用戶@走飯、@ sienna賽娜因抑郁癥而自殺的報道相符。
“有很多數據很值得關注的,比如有些表現出抑郁癥傾向的用戶除了喜歡用小號來表達痛苦情緒,還有群落聚集趨勢,他們會同時關注很多其他同類人群,有的甚至會習慣每天到已經自殺的用戶微博上評論‘今天你還好嗎?’,這聽起來有點瘆人。”
截至目前,實驗室從識別出的抑郁傾向用戶中,輔以人工判定約200名抑郁癥患者,研究者發現,有多人在微博中稱準備自殺。
據于霄介紹,除了抑郁傾向人群外,精神類疾病、危害社會行為(有暴力傾向人群)也是實驗室數據研究的方向,希望能夠對這些人群的提前干預提供數據支持。
焦點爭議
數據挖掘觸犯網友隱私?
有網友稱:“一想到死了微博還要被翻,就連死都毫無尊嚴”
事實上,利用大數據干預抑郁癥診斷及治療是否可行,微博用戶對此看法不一。持反對態度的網友@ sen哥-認為:“一想到萬一我死了微博也會被素不相識的人翻出來,就覺得連死這件事都他媽的毫無尊嚴。”持支持態度的網友@ La_Prairie認為:“多一些關愛,就少一些遺憾。”
中山大學心理學系教授周欣悅也對此表示擔憂,”抑郁癥患者未必就愿意讓別人知道自己有抑郁癥,如果公開給別人貼標簽就不太好。
于霄告訴記者,大數據的隱私權一直是敏感話題,當用戶看到自己的性格特征、人際交往等通過數據挖掘整理被羅列出來,肯定會很驚訝,但實驗團隊認為,由于搜集的是微博上用戶自愿公開的數據,并非私人聊天記錄,用戶被侵犯的感覺會小很多,當然這還需要整個社會對大數據挖掘的理解。
不過于霄強調,不會把識別出的抑郁癥用戶數據對外公布,他們希望的是這些數據能得到衛生部門或醫療機構的重視和介入。“對愿意為這部分人群提供幫助的專業機構,他建議可以聯系其新浪微博@社會網絡與數據挖掘,共同研究微博抑郁傾向用戶自殺干預方案。
大數據識別,結論科學嗎?
心理醫生:可做初篩不適合作為確診手段
”大數據“正在成為當下的一個熱詞,于霄與其伙伴們所運用的正是這一利器。但這項研究的科學性到底如何?業界如何評價?能否作為公認的心理學評估手段?于霄告訴記者,他們把這些數據提供給北京、上海的一些精神病醫院,得到了不少專家的認可,“不過專家會私下里說,應該就是(抑郁癥患者)了,但不會明確判別,從醫學手段來看,這樣就做判斷會顯得不嚴謹。”
中山三院精神科副主任醫師陶炯昨日接受南都記者采訪時認為,利用大數據來識別抑郁癥患者,有一定參考價值,一定程度上反映了用戶的情緒,可以作為對這個群體初篩的一種方式。但就此給這名微博用戶貼上“抑郁癥”標簽還不行,因為每個人都會有情緒發泄的時候,如何甄別這些是否“假陽性”,要確診還需要醫生面談。他建議,可以給識別出的高危人群做些專業測試,比如可以讓用戶在網絡上填些量表問卷。
與陶炯看法不太相同的是,中山大學心理學系周欣悅教授認為,這種關鍵詞聯系是相關關系,不是因果關系,預測的人群能否作為真正適合干預的人群很難說,需要更深入地研究。
背景資料
據公開數據,我國抑郁癥發病率約為3%~5%,目前已有超過2600萬人患抑郁癥。全國地市級以上醫院對抑郁癥的識別率不到20%。
數據還顯示,在過去50年里,我國平均每年有28.7萬人死于自殺,200萬人自殺未遂。自殺人群中有63.5%患有抑郁癥,但僅9%在自殺前曾到精神科或心理咨詢機構就診。