成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

清華大學研發 LLM4VG 基準:用于評估 LLM 視頻時序定位性能

人工智能
大語言模型(LLM)的觸角已經從單純的自然語言處理,擴展到文本、音頻、視頻等多模態領域,而其中一項關鍵就是視頻時序定位(Video Grounding,VG)。

12 月 29 日消息,大語言模型(LLM)的觸角已經從單純的自然語言處理,擴展到文本、音頻、視頻等多模態領域,而其中一項關鍵就是視頻時序定位(Video Grounding,VG)。

VG 任務的目的基于給定查詢(一句描述),然后在目標視頻段中定位起始和結束時間,核心挑戰在于時間邊界定位的精度。

清華大學研究團隊近日推出了“LLM4VG”基準,這是一個專門設計用于評估 LLM 在 VG 任務中的性能。

此基準考慮了兩種主要策略:第一種涉及直接在文本視頻數據集(VidLLM)上訓練的視頻 LLM,第二種是結合傳統的 LLM 與預訓練的視覺模型。

在第一種策略中,VidLLM 直接處理視頻內容和 VG 任務指令,根據其對文本-視頻的訓練輸出預測。

第二種策略更為復雜,涉及 LLM 和視覺描述模型。這些模型生成與 VG 任務指令集成的視頻內容的文本描述,通過精心設計的提示。

這些提示經過專門設計,可以有效地將 VG 的指令與給定的視覺描述結合起來,從而讓 LLM 能夠處理和理解有關任務的視頻內容。

據觀察,VidLLM 盡管直接在視頻內容上進行訓練,但在實現令人滿意的 VG 性能方面仍然存在很大差距。這一發現強調了在訓練中納入更多與時間相關的視頻任務以提高性能的必要性。

而第二種策略優于 VidLLM,為未來的研究指明了一個有希望的方向。該策略主要限制于視覺模型的局限性和提示詞的設計,因此能夠生成詳細且準確的視頻描述后,更精細的圖形模型可以大幅提高 LLM 的 VG 性能。

總之,該研究對 LLM 在 VG 任務中的應用進行了開創性的評估,強調了在模型訓練和提示設計中需要更復雜的方法。

IT之家附上論文參考地址:https://arxiv.org/pdf/2312.14206.pdf

責任編輯:龐桂玉 來源: IT之家
相關推薦

2025-04-23 09:06:00

AI模型LLM

2024-07-05 15:06:00

2024-06-18 14:01:17

2024-04-03 10:05:00

LLM性能基準測試

2024-12-02 07:10:00

DeeR-VLALLM多模態模型

2024-04-11 14:12:53

2024-07-08 06:30:00

2024-01-22 07:08:00

2013-09-27 17:29:16

清華大學IT運維RIIL

2021-07-08 15:39:50

機器學習人工智能計算

2024-03-04 00:05:00

人工智能LLM 評估

2011-10-26 10:57:56

EqualLogic戴爾存儲

2024-05-10 14:35:56

人工智能大型語言模型

2024-05-27 00:45:00

2010-03-09 16:11:10

虛擬化vmware

2023-06-30 09:00:00

Falcon LLM開源

2023-11-23 13:24:54

AI模型

2024-10-08 09:30:00

AI模型

2025-05-26 09:57:46

2025-05-23 09:18:25

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一区二区视频 | 看羞羞视频 | 男女羞羞的网站 | 日韩精品一区二区三区中文在线 | 国产精品视频一区二区三 | 韩国精品一区 | 视频一区二区在线观看 | 日韩精品在线网站 | 亚洲第一av | 免费精品视频一区 | 久久成人高清视频 | 欧美电影免费观看高清 | 久久999 | 久久精品屋 | 浮生影院免费观看中文版 | 国产亚洲一区二区三区 | 欧美成人免费在线 | 少妇特黄a一区二区三区88av | 精品久久久久久久久久 | 国产乡下妇女做爰 | 日韩一区二区三区在线视频 | 久久国产精品久久久久久 | 国产一区二区在线免费观看 | 欧美国产精品一区二区三区 | 欧美freesex黑人又粗又大 | 日韩视频精品在线 | 国产综合精品一区二区三区 | 国产乱码精品1区2区3区 | 欧美a区| 毛片一区二区三区 | 午夜a√| 亚洲一区二区三区在线观看免费 | 超碰av在线| 中文字幕视频在线 | 综合色久 | 亚洲人成一区二区三区性色 | 三级免费| 亚洲黄色av | 一级片毛片 | 欧美aaaaaaaaaa | 亚洲综合视频 |