成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%

發布于 2025-3-14 00:29
瀏覽
0收藏

盡管DeepSeek-R1風格的模型在語言模型中已經取得了成功,但其在多模態領域的應用仍然有待深入探索。

上交大等提出并開源 Visual-RFT,將 RFT 擴展到視覺任務,通過設計針對不同視覺任務的可驗證獎勵函數,提升 LVLMs 在視覺感知和推理任務中的性能。

視覺強化微調(Visual-RFT)的概述。與(a)數據驅動的視覺指令微調相比,(b)視覺強化微調(Visual-RFT)在有限數據下更具數據效率。(c)成功地將RFT應用于一系列多模態任務,并在底部展示了模型的推理過程示例。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

Visual-RFT 的核心在于利用 LVLMs 生成多個包含推理過程和最終答案的響應,并通過可驗證獎勵函數對模型進行策略優化。具體步驟如下:

  • 任務輸入:模型接收圖像和問題作為輸入。
  • 響應生成:LVLMs 生成多個可能的響應,每個響應包含推理過程和最終答案。
  • 獎勵計算:針對不同任務(如目標檢測、分類等),設計特定的可驗證獎勵函數,如 IoU 獎勵(用于目標檢測)和分類準確率獎勵。
  • 策略優化:使用 GRPO 等策略優化算法,根據獎勵函數更新模型參數。

可驗證獎勵函數

  • IoU 獎勵(目標檢測):通過計算預測邊界框與真實邊界框的交并比(IoU)來評估檢測任務的獎勵。
  • 分類準確率獎勵(分類任務):通過比較模型輸出類別與真實類別來評估獎勵。

視覺強化微調(Visual-RFT)的框架。給定問題和視覺圖像輸入后,策略模型會生成多個包含推理步驟的響應。然后,使用可驗證獎勵(如IoU獎勵和分類獎勵)與策略梯度優化算法來更新策略模型。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

在細粒度圖像分類、少樣本目標檢測、推理定位以及開放詞匯目標檢測基準測試中的實驗結果表明,與監督微調(SFT)相比,Visual-RFT具有競爭力的性能和先進的泛化能力:

  • 在大約100個樣本的單樣本細粒度圖像分類中,Visual-RFT的準確率比基線提高了24.3%。
  • 在少樣本目標檢測中,Visual-RFT在COCO的兩樣本設置中超過了基線21.9,在LVIS上超過了15.4。

Visual-RFT代表了對LVLMs微調范式的一種轉變,提供了一種數據高效、由獎勵驅動的方法,增強了對特定領域任務的推理能力和適應性。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

細粒度圖像分類的定性結果。推理過程顯著提升了大型視覺語言模型(LVLMs)的推理能力,從而提高了圖像分類的性能。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

在LISA [11] 數據集上的推理定位任務的定性結果。通過Visual-RFT,推理過程顯著提升了模型的推理定位能力。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

https://arxiv.org/pdf/2503.01785
Visual-RFT: Visual Reinforcement Fine-Tuning
https://github.com/Liuziyu77/Visual-RFT

本文轉載自??PaperAgent??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 一区二区三区不卡视频 | 亚洲精品乱码久久久久久蜜桃91 | 国产精品高潮呻吟久久 | 国产精品一区一区三区 | 色综合色综合 | 久久中文视频 | 精品亚洲一区二区 | 99re国产视频 | 亚洲综合国产精品 | 午夜久久久久久久久久一区二区 | 亚洲第一av | 国产不卡一区 | 欧美综合一区二区三区 | 亚洲成人毛片 | 成人性生交大片 | www.99热这里只有精品 | 久国久产久精永久网页 | 欧美激情五月 | 国产视频2021| 国产亚洲网站 | 国产精品日韩欧美一区二区三区 | 免费av播放| 久久国产精品一区二区三区 | 国产激情精品一区二区三区 | www.蜜桃av | 亚洲一区二区三区在线视频 | 亚洲精品一区二区三区中文字幕 | 亚洲精品女人久久久 | 99热碰| 欧美在线视频一区二区 | 一级毛片高清 | 一级做a| 欧美激情国产日韩精品一区18 | 亚洲有码转帖 | 天堂中文av| 国产这里只有精品 | 青娱乐一区二区 | 亚洲精久久久 | 国产一区二区精品在线 | 久久久久国产 | 伊人狠狠|