成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

幫視障人士“看見”圖片 字節跳動最新視覺語言預訓練模型入選ICML 2022

新聞
信息無障礙研究會發布的報告顯示,超過90%的視障人士會使用智能手機了解外面的世界。

近日,字節跳動AI Lab Research 團隊推出一項視覺語言預訓練模型,支持多模態的理解和生成,例如將畫面轉化為準確、流暢的描述文字,幫助視障人士“看見”圖片。這項技術成果已入選人工智能國際頂級會議ICML 2022,并應用于今日頭條App、大力智能燈等業務場景。

據了解,這個名為X-VLM 的模型在業內首次提出學習多粒度的視覺和語言對齊,能為圖片生成更為精準的描述,比如更正確地識別物體、描述物體間的關系。

信息無障礙研究會發布的報告顯示,超過90%的視障人士會使用智能手機了解外面的世界。此前,手機系統自帶的讀屏軟件已經實現把屏幕上的文字念出來,幫助視障人士“讀”新聞、“看”文章。可遇到文章中的圖片,讀屏軟件往往無法識別,只能播報“圖片”二字。

采用了X-VLM 模型,今日頭條App可以自動識別圖片,還能將它們“翻譯”成通順流暢的語句,并通過語音播報出來,助力視障人士解決讀圖難題。

值得一提的是,X-VLM可在模型規模和預訓練數據有限的情況下實現高效訓練。數據顯示:216M參數量的X-VLM模型就能在圖像文本檢索、基于圖片的問答或推理、視覺定位、圖片描述生成等廣泛的多模態任務上獲得十分優秀的表現。目前,X-VLM在字節跳動的真實應用場景上的表現已超過一些業界領先的最新模型。

近年來,人工智能在助推無障礙環境方面發揮了重要作用。利用技術持續改進無障礙與適老化體驗是字節跳動在公益方面的重要方向。除了在抖音系產品中不斷完善無障礙功能,字節跳動還通過面向企業用戶的云服務平臺火山引擎,以技術輸出的方式,服務更廣泛的社會群體。

論文:Multi-Grained Vision Language
Pre-Training: Aligning Texts with Visual Concepts(
??https://arxiv.org/abs/2111.08276??

代碼:https://github.com/zengyan-97/X-VLM



責任編輯:黃顯東
相關推薦

2022-03-04 19:07:03

模型視覺人工智能

2017-12-26 13:53:31

深度學習遷移學習

2022-07-12 10:37:08

阿里巴巴達摩院機器學習

2023-07-22 13:30:02

模型視覺

2022-08-01 10:07:34

訓練模型圖片

2022-08-16 16:22:07

計算機視覺

2021-01-21 14:23:53

Facebook AI 人工智能

2024-06-28 16:03:38

2022-04-26 15:09:14

優化模型訓練

2021-10-13 18:59:42

AI

2013-10-11 11:27:15

微軟IEIE11

2022-03-21 17:56:59

大模型訓練訓練框架

2022-03-21 15:06:10

模型字節跳動框架

2025-06-19 10:09:55

2025-06-24 03:00:00

2023-01-03 16:54:27

字節跳動深度學習

2024-01-03 18:53:13

語言模型LLM

2020-06-11 17:17:55

百度大腦
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: k8久久久一区二区三区 | 欧美国产在线一区 | 国产视频中文字幕 | jdav视频在线观看免费 | 欧美一级在线观看 | 二区视频| 阿v视频在线观看 | 中国三级黄色录像 | 韩日一区二区三区 | 国产98在线 | 免费, | 亚洲一区久久久 | 亚洲一区电影 | 精品在线观看一区二区 | 亚洲福利视频一区二区 | 日韩欧美视频免费在线观看 | 国产午夜亚洲精品不卡 | 欧美一区二区三区在线 | 欧美性受xxx | 国产精品a级 | 国产精品久久 | 欧美日韩国产高清 | 久久久国产一区二区三区 | 亚洲一区二区在线播放 | 婷婷激情在线 | 久久91av| 成人国产在线观看 | 婷婷五月色综合 | 蜜桃在线播放 | 精品无码久久久久久国产 | 日韩欧美网 | 一区二区在线免费观看视频 | 一区二区三区电影网 | 精品视频在线一区 | 精品国产欧美一区二区三区成人 | 成人午夜在线 | 91午夜在线 | 色婷婷久久久亚洲一区二区三区 | 国产区第一页 | 在线91| 免费国产一区二区视频 | 成人综合一区 |