成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院

發(fā)布于 2025-1-20 10:39
瀏覽
0收藏

BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)

摘要

傳統(tǒng)的生物醫(yī)學人工智能(AI)模型,針對特定任務(wù)或模式設(shè)計,在實際應(yīng)用中往往表現(xiàn)出有限的靈活性,并且難以利用整體信息。通用型AI由于其解釋不同數(shù)據(jù)類型的能力以及為多樣化需求生成定制輸出的能力,具有解決這些限制的潛力。然而,現(xiàn)有的生物醫(yī)學通用型AI解決方案通常對研究人員、從業(yè)者和患者而言是重量級且閉源的。

在這里,我們提出了BiomedGPT,第一個開源且輕量級的視覺語言基礎(chǔ)模型,旨在作為一個能夠執(zhí)行各種生物醫(yī)學任務(wù)的通用型模型。在25項實驗中的16項里,BiomedGPT取得了最先進的結(jié)果,同時保持了計算友好的模型規(guī)模。我們還進行了人類評估,以評價BiomedGPT在放射學視覺問答、報告生成和總結(jié)方面的能力。BiomedGPT展現(xiàn)出強大的預(yù)測能力,在問答中的錯誤率僅為3.8%,在撰寫復(fù)雜放射科報告方面表現(xiàn)令人滿意,錯誤率為8.3%,并且在總結(jié)能力方面與人類專家的偏好得分幾乎相當,具有競爭力。我們的研究表明,通過多樣化的數(shù)據(jù)進行有效訓練能夠帶來更實用的生物醫(yī)學人工智能,從而提升診斷的準確性和工作流程的效率。

BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)

[2305.17100] BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks

??https://arxiv.org/abs/2305.17100??

??https://github.com/taokz/BiomedGPT??


核心速覽

研究背景

  1. 研究問題:這篇文章要解決的問題是如何設(shè)計一個通用的生物醫(yī)學視覺語言基礎(chǔ)模型(BiomedGPT),以解決現(xiàn)有生物醫(yī)學人工智能(AI)模型在現(xiàn)實世界部署中的靈活性有限和難以利用整體信息的問題。
  2. 研究難點:該問題的研究難點包括:現(xiàn)有模型通常是針對特定任務(wù)或模態(tài)設(shè)計的,缺乏跨任務(wù)和模態(tài)的通用性;通用模型需要處理多種數(shù)據(jù)類型,計算復(fù)雜度較高;需要在保持模型性能的同時,降低模型的規(guī)模和復(fù)雜性。
  3. 相關(guān)工作:該問題的研究相關(guān)工作包括:傳統(tǒng)的生物醫(yī)學AI模型通常針對特定任務(wù)進行優(yōu)化,如放射學解釋、臨床信息總結(jié)和精確疾病診斷;現(xiàn)有的通用AI模型如GPT-3等在自然語言處理領(lǐng)域表現(xiàn)出色,但在生物醫(yī)學領(lǐng)域的應(yīng)用較少,且大多為閉源模型。

研究方法

這篇論文提出了BiomedGPT,用于解決生物醫(yī)學AI模型在現(xiàn)實世界部署中的靈活性和通用性問題。具體來說,

  1. 模型架構(gòu):BiomedGPT采用Transformer架構(gòu),設(shè)計為編碼器-解碼器結(jié)構(gòu),能夠處理視覺和文本輸入。模型通過離散化數(shù)據(jù)為標記,并使用ViT和語言模型的思想實現(xiàn)輸入/輸出的統(tǒng)一。BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)
  2. 預(yù)訓練任務(wù):預(yù)訓練任務(wù)包括掩碼圖像建模(MIM)、對象檢測、掩碼語言建模(MLM)、圖像描述和視覺問答(VQA)。這些任務(wù)的指令分別為:“中間部分的圖像是什么?”、“圖像中有哪些對象?”、“‘{Text}’的完整文本是什么?”、“圖像描述了什么?”和“{Question}”。
  3. 多任務(wù)學習:BiomedGPT支持視覺、文本和視覺語言任務(wù)的抽象,通過預(yù)訓練和微調(diào)實現(xiàn)多任務(wù)學習。預(yù)訓練任務(wù)包括視覺任務(wù)(MIM、MLM、圖像描述、VQA)和文本任務(wù)(MLM)。
  4. 零樣本學習:BiomedGPT能夠在無需進一步訓練的情況下回答多模態(tài)醫(yī)學問題,展示了其零樣本學習能力。

實驗設(shè)計

  1. 數(shù)據(jù)收集:預(yù)訓練數(shù)據(jù)集包括592,567張圖像、約1.83億文本句子、46,408個對象標簽對和271,804個圖像-文本對。微調(diào)數(shù)據(jù)集涵蓋了多個生物醫(yī)學任務(wù),如醫(yī)學圖像分類、文本理解和總結(jié)、視覺問答等。
    BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)
  2. 模型版本:設(shè)計了三個版本的BiomedGPT模型,分別對應(yīng)小(S)、中(M)和大(B)規(guī)模,以適應(yīng)不同的計算資源和任務(wù)需求。
  3. 評估指標:使用多種評估指標來衡量模型的性能,包括準確率、F1分數(shù)、ROUGE-L、METEOR、CIDEr等。

結(jié)果與分析

  1. 預(yù)訓練效果:BiomedGPT在預(yù)訓練階段通過大規(guī)模數(shù)據(jù)集的學習,建立了穩(wěn)健和通用的數(shù)據(jù)表示。模型在多個預(yù)訓練任務(wù)上表現(xiàn)出色,特別是在視覺問答和圖像描述任務(wù)上。
  2. 微調(diào)性能:在微調(diào)階段,BiomedGPT在多個生物醫(yī)學任務(wù)上取得了顯著的性能提升。例如,在醫(yī)學圖像分類任務(wù)中,BiomedGPT在多個數(shù)據(jù)集上的準確率均超過了現(xiàn)有的最先進模型;在文本理解和總結(jié)任務(wù)中,ROUGE-L評分也顯著提高。
    BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)
  3. 零樣本學習:BiomedGPT展示了其在零樣本學習中的潛力,能夠在無需進一步訓練的情況下回答多模態(tài)醫(yī)學問題,性能與領(lǐng)先的AI模型相當。
  4. 人類評估:通過放射科醫(yī)生的評估,BiomedGPT在視覺問答、報告生成和總結(jié)任務(wù)中表現(xiàn)出色,顯示出其在實際臨床應(yīng)用中的潛力。
    BiomedGPT:一種用于多樣化生物醫(yī)學任務(wù)的通用型跨模態(tài)基礎(chǔ)模型 - 賓州Lehigh大學、佐治亞大學、哈佛醫(yī)學院-AI.x社區(qū)

總體結(jié)論

這篇論文提出的BiomedGPT是一個開源且輕量級的視覺語言基礎(chǔ)模型,能夠在多種生物醫(yī)學任務(wù)中表現(xiàn)出色。研究表明,通過大規(guī)模數(shù)據(jù)集的預(yù)訓練和微調(diào),可以有效提高生物醫(yī)學AI模型的實用性和診斷效率。盡管BiomedGPT在多個任務(wù)中表現(xiàn)出色,但在安全、公平和偏見方面仍需進一步的評估和改進。未來的研究可以集中在優(yōu)化模型的性能,擴展其應(yīng)用范圍,并確保其在實際臨床環(huán)境中的可靠性和安全性。

論文評價

優(yōu)點與創(chuàng)新

  1. 開源與輕量級:BiomedGPT是第一個開源且輕量級的視覺語言基礎(chǔ)模型,參數(shù)規(guī)模僅為商業(yè)通用生物醫(yī)學AI模型Med-PaLM M的3088分之一,顯著降低了計算和部署的復(fù)雜性。
  2. 多模態(tài)處理能力:BiomedGPT能夠處理視覺和文本輸入,并通過序列化處理表格數(shù)據(jù),展示了其在多模態(tài)任務(wù)中的強大能力。
  3. 廣泛的預(yù)訓練數(shù)據(jù)集:BiomedGPT使用了包含592,567張圖像、約1.83億文本句子、46,408個對象標簽對和271,804個圖像-文本對的大規(guī)模預(yù)訓練語料庫,確保了模型的泛化能力。
  4. 指令遵循能力:開發(fā)了Instruct-BiomedGPT變體,通過特定的指令調(diào)優(yōu)數(shù)據(jù)提升了模型的指令遵循能力。
  5. 零樣本學習:BiomedGPT能夠在不進行額外訓練的情況下回答多模態(tài)醫(yī)學問題,表現(xiàn)出與領(lǐng)先AI相當?shù)男阅堋?/li>
  6. 人類評估:在放射學視覺問答、報告生成和摘要等任務(wù)中進行了人類評估,展示了BiomedGPT在實際臨床應(yīng)用中的潛力。
  7. 多任務(wù)學習:BiomedGPT展示了出色的多任務(wù)學習能力,簡化了AI系統(tǒng)的部署和管理。

不足與反思

  1. 數(shù)據(jù)質(zhì)量和多樣性:開發(fā)AI依賴于高質(zhì)量和標注的數(shù)據(jù),但在生物醫(yī)學領(lǐng)域,數(shù)據(jù)注釋昂貴且耗時,導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊。現(xiàn)有數(shù)據(jù)集大多集中在放射學,導(dǎo)致模態(tài)不平衡。
  2. 生成文本的事實準確性:評估生成文本的質(zhì)量存在挑戰(zhàn),盡管CIDEr和ROUGE-L等指標可以衡量生成內(nèi)容與黃金標準的相似性,但確保這些輸出的事實準確性仍然是一個問題。
  3. 模型擴展的復(fù)雜性:BiomedGPT目前專注于處理圖像和文本數(shù)據(jù),但擴展其能力以涵蓋其他類型的生物醫(yī)學數(shù)據(jù)(如視頻和時間序列數(shù)據(jù))可能會引入負遷移問題。
  4. 計算效率:盡管BiomedGPT在零樣本預(yù)測和微調(diào)后表現(xiàn)出色,但擴展模型規(guī)模帶來的計算挑戰(zhàn)仍然存在。探索可控學習策略如專家混合方法可能有助于緩解這些問題。
  5. 文本理解能力:與GPT-4V相比,BiomedGPT的文本理解能力尚未完全建立,特別是在復(fù)雜醫(yī)學應(yīng)用中。未來的研究應(yīng)專注于提高上下文學習和文本理解的性能。

關(guān)鍵問題及回答

問題1:BiomedGPT在預(yù)訓練過程中使用了哪些具體的任務(wù)和數(shù)據(jù)集?這些任務(wù)和數(shù)據(jù)集的選擇對模型性能有何影響?

BiomedGPT在預(yù)訓練過程中使用了多種任務(wù)和數(shù)據(jù)集,包括掩碼圖像建模(MIM)、對象檢測、掩碼語言建模(MLM)、圖像描述和視覺問答(VQA)。具體數(shù)據(jù)集包括IU X-ray、MediCat、PathVQA、PEIR GROSS和SLAKE等。這些任務(wù)和數(shù)據(jù)集的選擇對模型性能有顯著影響,因為它們涵蓋了視覺和文本的多種模態(tài),確保了模型的泛化能力。特別是,使用大規(guī)模和多樣化的數(shù)據(jù)集有助于模型學習到更穩(wěn)健和通用的數(shù)據(jù)表示,從而在多個下游任務(wù)中表現(xiàn)出色。

問題2:BiomedGPT在微調(diào)階段的表現(xiàn)如何?它在哪些具體任務(wù)上取得了顯著的性能提升?

在微調(diào)階段,BiomedGPT在多個生物醫(yī)學任務(wù)上取得了顯著的性能提升。例如,在醫(yī)學圖像分類任務(wù)中,BiomedGPT在多個數(shù)據(jù)集上的準確率均超過了現(xiàn)有的最先進模型;在文本理解和總結(jié)任務(wù)中,ROUGE-L評分也顯著提高。具體來說,BiomedGPT在醫(yī)學圖像分類任務(wù)中的準確率在多個數(shù)據(jù)集上達到了90%以上,在文本總結(jié)任務(wù)中的ROUGE-L評分接近50%。這些結(jié)果表明,BiomedGPT能夠通過微調(diào)有效地適應(yīng)不同的生物醫(yī)學任務(wù),展現(xiàn)出強大的多任務(wù)學習能力。

問題3:人類評估中,BiomedGPT在哪些具體任務(wù)上表現(xiàn)出色?評估結(jié)果如何?

在人類評估中,BiomedGPT在視覺問答、報告生成和總結(jié)任務(wù)中表現(xiàn)出色。具體來說,在放射科醫(yī)生的評估中,BiomedGPT在視覺問答任務(wù)中的平均得分為1.75,總分達到91分;在報告生成任務(wù)中,生成的報告在事實性、遺漏和錯誤嚴重性方面的得分分別為23.3%、23.5%和8.3%;在報告總結(jié)任務(wù)中,生成的總結(jié)在完整性、正確性和潛在醫(yī)療危害方面的得分分別為81.0%、90.0%和6.0%。這些評估結(jié)果表明,BiomedGPT在實際臨床應(yīng)用中具有較高的潛力,能夠生成高質(zhì)量的報告和總結(jié),輔助醫(yī)生進行診斷和治療。

本文轉(zhuǎn)載自 ??知識圖譜科技??,作者: KGGPT

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 免费黄色成人 | 亚洲日本视频 | 精品产国自在拍 | 成人精品一区二区三区 | 国产精品av久久久久久久久久 | 91天堂网 | 欧美a在线 | 91精品国产综合久久久久久首页 | 亚洲一区二区免费视频 | 色www精品视频在线观看 | 国产精品1区2区3区 国产在线观看一区 | 久草在线 | 久久综合一区 | 一区二区三区亚洲精品国 | www.色五月.com | 亚洲五码久久 | 久久精品免费观看 | 人人做人人澡人人爽欧美 | 伊人春色在线观看 | 国产精品99久久久久久大便 | 日韩av免费看 | 国产一区二区在线播放 | 老司机成人在线 | 免费高潮视频95在线观看网站 | 99久久99| 成人黄色在线 | 亚洲三区在线观看 | 日韩第一区 | 久久久久久久一区 | 午夜二区| 久久久久久久一区 | 国产黄色麻豆视频 | 五月综合色啪 | 人人九九 | 久久久久久综合 | 久久一区二区视频 | 亚洲黄色一区二区三区 | 国产成人午夜精品影院游乐网 | 欧美日韩成人 | 91在线观看 | 999久久久久久久久6666 |