成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一次多模態大模型表格識別解析探索小實踐記錄

發布于 2024-11-21 10:14
瀏覽
0收藏

表格識別作為文檔智能的重要組成部分,面臨著復雜結構和多樣化格式的挑戰。 ??【文檔智能 & RAG】RAG增強之路:增強PDF解析并結構化技術路線方案及思路??

一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

前期文章也介紹了傳統視覺的方法進行表格結構識別的方法,??【文檔智能】輕量級級表格識別算法模型-SLANet??

關于表格識別在這里就不做過多的介紹了。

國慶期間,筆者利用一個較長的時間段,訓練了一個多模態的表格識別模型,效果還不錯,特此記錄一下多模態的效果。

  • 訓練資源:H100*8
  • 訓練數據:200w table image - table html對(html的表示表格的優勢,可以準確表示一些復雜表格,如合并單元格等,這點是mardown格式無法做到的。)
  • 模型參數量:7B
  • 自建測評數據TEDS:0.97~0.98

小總結:

  1. 訓練數據質量大于一切,含大量數據的超長文本表格目前還不能準確識別,因為筆者訓練的是??max-length=8192??。
  2. 模型參數量目前較大,推理速度比較慢。

效果記錄: 下面的一些case來源于網絡的表格截圖。

一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case1


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case2


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case3


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case4


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case5


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case6


一次多模態大模型表格識別解析探索小實踐記錄-AI.x社區

case7


本文轉載自公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/MrlNdZKvO5byUIi21sBinw??

已于2024-11-28 18:51:29修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 久久久精彩视频 | 欧美黄色片 | 国产第一页在线观看 | 日韩色视频 | 亚洲午夜精品视频 | 亚洲综合小视频 | 成人毛片网 | 日韩av免费看 | 天天视频一区二区三区 | 亚洲一区电影 | 亚洲欧美日韩一区二区 | 你懂的在线视频播放 | 欧美在线 | 日本一本视频 | 欧美久久久网站 | 欧美黄色片 | 欧美视频在线播放 | 欧美一级特黄aaa大片在线观看 | 亚洲国产成人av好男人在线观看 | 午夜影院毛片 | 黄色在线免费观看 | 国产一区二区三区久久久久久久久 | 青青伊人久久 | 日本在线黄色 | 日韩中文字幕在线视频 | 日韩精品一区二区三区老鸭窝 | 久久精品免费观看 | 中文在线播放 | 亚洲欧美综合精品久久成人 | 欧美日韩一区二区三区不卡视频 | 国产高清视频 | 黄色免费观看网站 | 欧美日韩国产精品一区 | 国产精品美女www爽爽爽视频 | 精品国产乱码久久久久久丨区2区 | 午夜视频精品 | 亚洲欧美日韩网站 | 草久久久 | 欧美久久一级特黄毛片 | 国产高清在线精品 | 精品亚洲一区二区三区四区五区高 |