全網“最丑”驗證碼上線,助力醫療影像標注及診斷
2月3日,騰訊聯合深圳大學,研發并上線了一批“特殊”的驗證碼,與其他常見的圖片驗證碼不同,它們全部由清一色的黑白灰圖片構成。
這批驗證碼全名為“MedCAPTCHA 醫學圖像驗證碼”,由騰訊安全平臺部和深圳大學生物醫學工程學院合作研發,驗證中所用到的圖片,全部來自于臨床上真實的脫敏醫學圖像,通過驗證碼的形式開放給廣大網民自愿體驗及參與標注。
雙方期望運用技術的力量,解決社會醫療流程和資源存在的痛點,讓醫療影像的標注和診斷變得更加高效和準確,進而減少病人延誤診斷或漏診的情況。
目前,在騰訊防水墻官網灰度上線后,已有近萬名用戶體驗了MedCAPTCHA醫學圖像驗證碼,累計貢獻了近2萬條正確標注的醫學圖像數據,項目也在持續迭代優化中。
MedCAPTCHA醫學圖像驗證碼已在騰訊防水墻官網灰度上線
醫學診療和研究的“路標”
在醫學上,90%的臨床診斷需要借助經過標注的醫學影像——病灶和相關器官的有效標注數據,能幫助醫生在疾病診斷、病情評估、發展趨勢預測、治療策略制定等方面,提供重要的定量化信息。
被標注的醫學圖像,融入了專家的經驗知識與判斷,能夠縮減廣大醫務人員的重復工作和勞動時間,還可以應用在AI輔助醫學診斷等領域,有效推動醫學研究和臨床診療的高效開展。
但現階段對于有限的醫務人力資源而言,醫學圖像的勾畫標注,是一項相當龐大而繁雜的工作。僅僅是針對單個病人的一組醫學圖像,簡單的需要半小時完成勾畫,復雜的則要花上一兩小時。
在過去的四十年中,學術界和工業界的研究人員研發了大量基于人工智能輔助的半自動甚至全自動的標注算法,但是這些算法模型,往往需要經過足夠多的標注醫學圖像數據訓練,才能達到普適性更強、準確度更高的分類或診斷效果。因此,快速獲取海量的、具有準確標注的醫學圖像數據,對醫療領域來說困難且迫切,僅僅依靠少數專業醫務者或醫學研究人員的力量遠遠不夠。
安全驗證技術與醫學的跨界融合
驗證碼是一種人機識別手段,其主要作用是防止垃圾注冊、刷量刷票、論壇灌水等惡意行為。從安全角度出發,其主要意義是降低某一些用戶用特定程序暴力破解方式進行網站登錄,獲取相關驗證用戶的信息,保證用戶的信息安全。
公開數據顯示,全球網民每日累計輸入驗證碼近2億次,而我國網民規模超過9.4億。按照這一數據估算,如果借助龐大網民群體的力量,就能夠在1小時內勾畫完成4家大型醫院整整一年所需的醫學圖像標注量。
基于這一想法,騰訊安全平臺部防水墻團隊與深圳大學醫學工程學院高毅教授團隊合作研發并灰度上線了“MedCAPTCHA醫學圖像驗證碼”公益實踐項目,供廣大網民自愿體驗。研發人員把深圳大學提供的未經標注的海量脫敏醫學圖像,以圖片驗證碼的形式上線防水墻官網。
MedCAPTCHA在線驗證模式
在這個自愿體驗的安全驗證環節中,用戶只需要參照給出的圖片示例“照貓畫虎”,移動鼠標在圖片上進行簡單勾畫,就能完成在線驗證,并成功提供了一次醫學圖像標注答案。
針對嚴肅而細致的醫學研究及診療場景,人機驗證模式讓廣大網民參與到醫學圖像標注的初篩工作中來。而對于收集到的圖像標注信息,專業醫學研究人員會在后臺對收集到的圖像標注信息進行融合和篩選處理,最終將質量最優的數據提供給大數據工作者和醫生群體。
人工識別標注的結果,將為公共醫療統計、精準醫療分析提供可靠的、核心的影像特征基礎,還可以作為機器學習的訓練樣本,促進人工智能在醫療領域的更多應用。該公益項目也正在聯合騰訊用戶研究與體驗設計團隊(CDC)持續迭代優化中。
即使是不具備任何專業醫學知識的普通網民,也能起到至關重要的作用,共同助力醫療影像的標注和診斷變得更高效、更準確。