成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級革命

發(fā)布于 2024-10-30 15:23
瀏覽
0收藏

論文筆記分享,標題Beyond Text: Optimizing RAG with Multimodal Inputs for Industrial Applications

多模態(tài)VL模型很早的就進入了這個圈子,早的有LLava,近一點的gpt4o。這個內容的主要想論證一個事情,在工業(yè)界,同時包含文本和圖像的RAG系統(tǒng),相比于單文本的 RAG 系統(tǒng)會提高整體性能?

當然這個問題的結論是,會提高,所以還額外做了一些,優(yōu)化多模態(tài)流程探索的工作。

首先,多模態(tài)的結合,2種模式,一種是圖片保持不變,建立起圖片向量庫;另一種是圖片會提取出摘要描述用于召回。 分別對應了下圖

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級革命-AI.x社區(qū)

比較特別的是,這個論文用到的數(shù)據(jù)是私有的,測試數(shù)據(jù)是自己標的。 語料庫有8540 個片段,8377 張圖片。 測試數(shù)據(jù)由專業(yè)人士標注100個問答對。

考慮到,這里多模態(tài),現(xiàn)有的評測框架不夠用了,所以他們開發(fā)并開源了一個評測框架,具體的維度還是老幾樣,正確性,相關性,事實性等等。地址在:https://github.com/riedlerm/multimodal_rag_for_industry

評測結論如下圖,就看下圖左一,關注框框的對比把

  • 僅僅使用圖片的RAG,不管是不是摘要,效果基本都不如baseline  no rag
  • 使用text only的RAG系統(tǒng)已經(jīng)是個非常強的baseline了

多模態(tài)的RAG有潛力,但是很難打敗基于純文本的,但是如果圖片檢索厲害的話,還是能起飛的(黃框)

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級革命-AI.x社區(qū)

最后,在多模態(tài)RAG中,基于圖片摘要向量的比圖像直接做向量的,大部分指標都表現(xiàn)的好,受限于多模態(tài)向量的潛能,文本向量模型目前表現(xiàn)更好,也限制了這方面的發(fā)揮。總的來說,未來可期。

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級革命-AI.x社區(qū)

本文轉載自 ??NLP前沿??,作者: 熱愛AI的

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 欧美色专区 | 日韩精品免费播放 | 国产精品精品久久久 | 国产亚洲精品久久久久久豆腐 | 成人国产精品免费观看视频 | 综合欧美亚洲 | 在线免费黄色小视频 | 红色av社区 | 久久久国产一区 | 国产一级免费在线观看 | 在线观看成年人视频 | 中文字幕高清在线 | 黄色一级片在线播放 | 欧美日日 | 午夜爽爽爽男女免费观看影院 | 亚洲高清视频在线观看 | 欧美亚洲国产精品 | 国产精品久久久久久久久久了 | 中文字幕一区二区三区精彩视频 | 久久久亚洲综合 | 国产永久免费 | 国产日韩一区二区 | 国产精品波多野结衣 | 99精品视频一区二区三区 | 亚洲精品久久久久avwww潮水 | 色视频在线播放 | 精品在线一区二区三区 | 天天看天天干 | 精品综合| 久久久毛片 | 日韩av电影在线观看 | 日韩视频a| 影音先锋成人资源 | 视频一区二区三区中文字幕 | 91传媒在线观看 | 国产精品久久久久久久久久久久久久 | 精品在线一区 | 欧美在线精品一区 | 国产乱码精品1区2区3区 | 国产一区999 | 夜夜精品视频 |