成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲? 原創

發布于 2025-2-12 08:22
瀏覽
0收藏

01、概述

近年來,視覺-語言模型(VLMs)在人工智能領域的迅猛發展,極大拓展了機器處理多模態信息的能力。然而,在這項技術的進步背后,依然存在著一些亟待解決的挑戰。像 GPT-4V 和 Gemini-1.5-Pro 這樣的專有模型雖然表現出色,但它們的透明度較低,這限制了它們的適應性和開放性。而開放源代碼的替代模型常常因數據多樣性、訓練方法和計算資源的限制,難以與這些專有模型抗衡。此外,關于后期訓練數據策略的文獻資料相對匱乏,使得這些模型的復制和改進變得困難。

為了解決這些問題,NVIDIA AI 推出了 Eagle 2,一款采用結構化、透明的數據策劃和模型訓練方法的視覺-語言模型(VLM)。Eagle 2 提供了一個全新的視角,讓開放源代碼社區能夠在不依賴專有數據集的情況下,構建具有競爭力的 VLM。

02、Eagle 2:以透明為核心的數據策略

Eagle 2 的最大亮點在于它的開放數據策略。與大多數僅提供訓練權重的模型不同,Eagle 2 詳細介紹了數據收集、過濾、增強和選擇的整個過程。這一做法的目標是為開放源代碼社區提供一套完整的工具,使得社區成員可以在透明的框架下開展自己的 VLM 開發工作,而不再依賴于封閉的專有數據集。

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲?-AI.x社區

Eagle2-9B 是 Eagle 2 系列中最先進的模型,其性能已經能夠與一些擁有 70B 參數的模型媲美,證明了在優化后期訓練數據策略的同時,不必消耗過多的計算資源。

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲?-AI.x社區

03、Eagle 2 的三大創新亮點

Eagle 2 的成功,離不開以下三大創新:

1) 數據策略:多樣性優先,質量為先

Eagle 2 的數據策劃遵循 “多樣性優先,質量為先” 的原則。首先,從超過 180 個數據源中采集數據,隨后通過篩選和選擇進行精煉。在這個過程中,Eagle 2 引入了詳細的數據處理流程,包括錯誤分析、鏈式思維(CoT)推理、基于規則的問答生成以及數據格式化,旨在提高訓練效率。

2) 三階段訓練框架:逐步提升模型能力

Eagle 2 的訓練方法分為三個階段,每個階段都在強化模型的不同能力:

  • 階段 1:通過訓練多層感知器(MLP)連接器,調整視覺和語言的跨模態對接。
  • 階段 1.5:引入更大規模的數據,進一步夯實模型的基礎。
  • 階段 2:使用高質量的指令調優數據集對模型進行微調,提升其在實際應用中的表現。

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲?-AI.x社區

3) Tiled Mixture of Vision Encoders(MoVE)架構

Eagle 2 采用了兩種視覺編碼器——SigLIP 和 ConvNeXt,結合高分辨率的切片方法確保在處理圖像時,能夠高效地保留細粒度的圖像細節。此外,Eagle 2 還通過一種平衡意識的貪心背包方法優化了數據打包,提高了樣本效率,同時減少了訓練成本。

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲?-AI.x社區

04、Eagle 2 的性能與基準測試

Eagle 2 經歷了嚴格的性能測試,展現了出色的多項基準測試表現:

  • DocVQA:Eagle2-9B 在該任務中達到了 92.6% 的準確率,超越了 InternVL2-8B(91.6%)和 GPT-4V(88.4%)。
  • OCRBench:在該任務中,Eagle 2 取得了 868 分,超越了 Qwen2-VL-7B(845)和 MiniCPM-V-2.6(852),展示了其在文本識別方面的強大能力。
  • MathVista:Eagle 2 的表現較基準提升了超過 10 個點,進一步驗證了三階段訓練方法的有效性。
  • 多模態推理任務(如 ChartQA 和 OCR QA):Eagle 2 在這些任務中也表現出色,超越了 GPT-4V。

此外,Eagle 2 的訓練過程經過優化,采用了先進的子集選擇技術,將數據集的規模從 1270 萬樣本減少至 460 萬樣本,同時保持了準確性,并提高了數據利用效率。

9B參數吊打GPT-4V!NVIDIA開源新模型(Eagle 2),竟靠“透明數據”逆襲?-AI.x社區

05、總結:Eagle 2 —— 更具透明度和開放性的 VLM 解決方案

Eagle 2 的發布,標志著在使高性能視覺-語言模型更加可訪問和可復制方面邁出了重要一步。通過強調透明的數據驅動方法,Eagle 2 在開放源代碼社區與專有模型性能之間架起了橋梁。它在數據策略、訓練方法和視覺架構上的創新,使其成為研究人員和開發者的理想選擇。

通過公開分享其方法論,NVIDIA AI 不僅促進了一個協作的人工智能研究環境,還使得社區成員可以在此基礎上進一步創新,而不必依賴封閉的源代碼模型。隨著人工智能技術的不斷演進,Eagle 2 將成為思考數據策劃和訓練策略如何推動 VLM 發展的典范。



本文轉載自公眾號Halo咯咯    作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/OI0ykpgOR9v6h2RawYW-6Q??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-2-12 08:22:03修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 美女视频一区二区三区 | 99久久精品国产一区二区三区 | 国产精品色av | 久久99精品国产 | 日韩视频在线免费观看 | 日本成人毛片 | 精品一区二区三区在线观看 | 中文字幕视频在线免费 | 亚洲国产精品自拍 | 亚洲 成人 在线 | 午夜影院在线观看视频 | 超碰在线国产 | 激情久久网 | 精品视频一二区 | 荷兰欧美一级毛片 | 天天干狠狠干 | 日韩有码一区 | 欧美久久久久久久 | 成人午夜激情 | 国产一区91精品张津瑜 | 欧美日韩一区精品 | 久久69精品久久久久久久电影好 | 国产乱肥老妇国产一区二 | 国产高清视频一区 | 国产在线视频一区二区 | 日本手机在线 | 亚洲二区精品 | 久久99一区二区 | 99热热热| 国产成人精品一区二区三区在线 | 国产在线中文字幕 | 国产日韩欧美在线观看 | 欧美日韩精品久久久免费观看 | 一区二区三区在线 | 欧 | av手机在线 | 中文字幕乱码视频32 | 亚洲自拍偷拍av | 免费精品 | 国产1区 | 国产美女自拍视频 | 国产成人精品一区二区三区 |