成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣

新聞 人工智能
就在最近,國際權威機器視覺問答榜單VQA Leaderboard,更新了一項數據:AI在“讀圖會意”任務中,準確率達到了81.26%。

 [[417746]]

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

超越人類這件事上,AI 又拿下一分。

就在最近,國際權威機器視覺問答榜單VQA Leaderboard,更新了一項數據:

AI在“讀圖會意”任務中,準確率達到了81.26%

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

要知道,我們人類在這個任務中的基準線,也才80.83%

而解鎖這一成就的,是來自阿里巴巴達摩院團隊的AliceMind-MMU

而此舉也就意味著,AI 于2015年、2018年分別在視覺識別和文本理解超越人類之后,在多模態技術方面也取得了突破!

AI比你更會看圖

這個AI有多會看圖?

來看下面幾個例子就知道了。

當你問AI:“這些玩具用來做什么的?”

它就會根據小熊穿的禮服,回答道:

婚禮。

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

給AI再提一個問題:“男人的橄欖球帽代表哪只球隊?”

它會根據帽子中的“B”字母回答:

波士頓球隊

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

加大挑戰難度再來一個。

“圖中玩具人的IP出自哪部電影?”

這時候,AI 就會根據圖中的玩具,還有戰斗場景等信息,做一個推理。

不過最后還是精準的給出了答案:

星球大戰

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

再例如下面這些例子中,AI都會捕捉圖片中的細節信息,來精準回答提出的問題。

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

嗯,可以說是細致入微了。

怎么做到的?

可能上面的這些案例,對于人類來說并不是很困難。

但對于AI來說,可不是件容易的事情。

一個核心難點就是:

需要在單模態精準理解的基礎上,整合多模態的信息進行聯合推理認知,最終實現跨模態理解。

怎么破?

阿里達摩院的做法是,對AI視覺-文本推理體系進行了系統性的設計,融合了大量的創新算法。

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

具體來看,大致可以分為四個內容:

  • 多樣性的視覺特征表示:從各方面刻畫圖片的局部和全局語義信息,同時使用Region,Grid,Patch等視覺特征表示,可以更精準地進行單模態理解;
  • 基于海量圖文數據和多粒度視覺特征的多模態預訓練:用于更好地進行多模態信息融合和語義映射,提出了SemVLP、Grid-VLP、E2E-VLP和Fusion-VLP等預訓練模型。
  • 自適應的跨模態語義融合和對齊技術:在多模態預訓練模型中加入Learning to Attend機制,來進行跨模態信息地高效深度融合。
  • Mixture of Experts (MOE)技術:進行知識驅動的多技能AI集成。
<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

據了解,模型中涉及技術還得到了專業的認可。

例如多模態預訓練模型E2E-VLP,已經被國際頂級會議ACL2021接受。

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

關于VQA

VQA,可以說是AI領域難度最高的挑戰之一。

而對于單一AI模型來說,VQA考卷難度堪稱“變態”。

在測試中,AI需要根據給定圖片及自然語言問題,生成正確的自然語言回答。

這意味著單個AI模型,需要融合復雜的計算機視覺及自然語言技術:

  • 首先對所有圖像信息進行掃描。
  • 再結合對文本問題的理解,利用多模態技術學習圖文的關聯性、精準定位相關圖像信息。
  • 最后根據常識及推理回答問題。
<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

但解決VQA的挑戰,對研發通用人工智能具有重要意義。

因此,全球計算機視覺頂會CVPR從2015年起連續6年舉辦VQA挑戰賽。

吸引了包括微軟、Facebook、斯坦福大學、阿里巴巴、百度等眾多頂尖機構參與。

同時,也形成了國際上規模最大、認可度最高的VQA數據集,其包含超20萬張真實照片、110萬道考題。

<span><span><span><i style=首次超越人類!“讀圖會意”這件事,AI比你眼睛更毒辣 | 達摩院">

據了解,今年6月,阿里達摩院在VQA 2021 Challenge的55支提交隊伍中奪冠,成績領先第二名約1個百分點、去年冠軍3.4個百分點。

而僅僅在2個月后的今天,達摩院再次以81.26%的準確率創造VQA Leaderboard全球紀錄。

達摩院對此評價道:

這一結果意味著,AI在封閉數據集內的VQA表現已媲美人類。

相關論文鏈接:

[1]https://aclanthology.org/2021.acl-long.42/
[2]https://aclanthology.org/2021.acl-long.493/
[3]https://openreview.net/forum?id=Wg2PSpLZiH

VQA示例鏈接:
https://nlp.aliyun.com/portal#/multi_modal

達摩院AliceMind開源鏈接:
https://github.com/alibaba/AliceMind

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-12-01 15:22:02

AI阿里騰訊

2021-01-07 14:56:55

AI 數據人工智能

2021-07-28 11:54:09

阿里云AI自然語言理解

2022-02-18 09:53:17

AI芯片設計

2023-09-05 15:09:31

人工智能

2023-07-03 22:28:19

6GHz6G技術

2016-11-09 16:56:34

投資

2021-01-27 14:24:17

人工智能AI國際象棋AI

2014-12-17 17:18:44

Android進程root

2024-05-11 10:12:43

人工智能

2015-08-24 08:51:01

程序員讀書

2024-04-11 12:30:40

2023-09-15 11:01:51

人工智能

2019-10-31 14:37:55

技術人工智能開發

2015-09-16 14:20:25

2018-07-10 08:56:19

編程程序員開發

2023-05-12 17:45:15

MySQL索引排序

2019-04-04 13:33:17

2010-05-06 09:23:45

云計算

2013-12-20 09:19:18

計算機學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 狠狠干2020 | 草久久| 黄色小视频大全 | 青青艹在线视频 | 成人国产精品久久久 | 精品综合久久 | 亚洲精品专区 | 黄色国产视频 | 久久久一二三 | 欧美1级 | 久久国产精品一区二区三区 | 成人深夜福利网站 | 不卡一二区 | 日韩欧美在线观看视频网站 | 日本黄色短片 | 日韩和的一区二区 | 色视频一区二区 | 欧美一级免费看 | 欧美videosex性极品hd | 国产成人精品高清久久 | 亚洲国产成人久久久 | 91天堂| 久久成人国产精品 | 国产一区二区三区在线 | 国产成人aⅴ| 99热在线免费 | 国产原创视频 | 国产黄色免费网站 | 欧美日韩国产在线观看 | 成人精品一区二区三区四区 | 91中文字幕在线观看 | 国产激情精品一区二区三区 | 亚洲色图综合 | av资源网站 | 一级做受毛片免费大片 | 高清18麻豆 | 欧美日本在线观看 | 亚洲精品成人在线 | 中文字幕在线视频免费观看 | 欧美亚洲视频在线观看 | 国产免费xxx |