成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

人工智能
只要60分飄過八年級科學考試,就能收獲8萬美元獎金(折合人民幣57萬元)。只不過,參加考試的“學生”,必須是個AI。

只要60分飄過八年級科學考試,就能收獲8萬美元獎金(折合人民幣57萬元)。

[[276019]]

只不過,參加考試的“學生”,必須是個AI。

在長達四年的時間里,700多名計算機科學家參與到這項AI競賽當中,但他們的AI紛紛折戟,沒有一個能拿到及格分。

但現在,歷史新紀錄來了。艾倫研究所的一個名叫Aristo的AI搞定了這件事,不僅在8年級科學考試中答對了90%以上的問題,連高三的考試,它都能答對80%!

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

這對于AI來說,有點鵝妹子嚶了。

語言理解+邏輯,難倒AI

雖然AI下圍棋能贏世界冠軍,打德撲還會詐唬,IBM的Watson也早在智力問答《危險邊緣(Jeopardy!)》中大殺四方,但想要通過美國八年級科學考試,對AI來說仍然是一大挑戰。

即使排除了圖片題和圖表題,科學考試中的問答依然不是簡單的自然語言理解問題,還涉及到邏輯推理乃至常識——答案并不是明顯存在于某處文本中的。

舉個例子,在考試中,有的問題比較簡單,只涉及到信息檢索:

一組協同工作以執行特定功能的組織稱為:

(1)器官

(2)有機體

(3)系統

(4)細胞

但有的問題它長這個樣子:

什么樣的改變會導致區域內的松鼠數量減少?

(1)食肉動物數量減少

(2)松鼠之間的競爭減弱

(3)食物增加

(4)森林火災發生次數增多

這可就不是AI光靠學習規則就能回答的問題了,其中牽扯到的邏輯推理,對人類而言或許是小菜一碟,但對AI來說,并沒有那么簡單。

甚至還有多選問題。

就在AlphaGo震驚世界的2016年,最強的AI系統也只能在紐約州八年級科學考試中達到59.3%的準確率,遺憾未能及格。

基于Bert的Aristo

Aristo是怎樣實現突破的呢?

其實,它是站在了巨人的肩膀之上。

Aristo基于艾倫研究所的深度語境化詞表征ELMo(NAACL 2018最佳論文)和大名鼎鼎的BERT開發(現已替換為RoBERTa),集八種類型智能體于一身,有的智能體負責在數據庫中查找答案,有的負責檢查相關概念列表(元組),還有的專門執行邏輯推理。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

每個智能體都會為答案打分,而Aristo會對不同的分數進行加權,最終做出選擇決策。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在實驗測試中,研究人員讓Aristo參加了2017年到2019年各個年級的紐約州會考,結果顯示,Aristo在4年級和8年級的考試中正確率都到達了90%左右,符合紐約州教育部認定的“優秀標準”(85%)。而12年級考試的正確率則是83.54%,離優秀只差了一點點。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在此之前,這些考試數據并不在Aristo的訓練集中。

并且,現在Aristo的答題范圍不僅僅局限在文字問題中了,涉及到計算機視覺的圖表題,它也正在拿下。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰
AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在接受媒體采訪時,Aristo項目的高級經理Peter Clark表示:

Aristo的目標不僅僅是通過科學考試,而是創造一個對科學有更深入理解的系統。

雖然如從事類似研究的微軟研究員Jingjing Liu所說,實際上,Aristo仍然不具備“真正”的智能,我們無法將Aristo的能力與人類學生的推理能力相比較。但無疑,它創造了一個很好的應用方向。

比如更強大的搜索,比如個性化教育。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

對了,Aristo現在有了在線Demo,可以在線調戲喲。

傳送門

Demo:

http://aristo-demo.allenai.org/

數據集:

http://data.allenai.org/ai2-science-questions/

相關論文:

https://allenai.org/papers/papers-aristo-2019.html

 

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2024-06-06 09:18:48

2025-03-03 09:40:00

2022-12-28 13:57:56

AI模型語言

2022-06-09 09:48:46

AI預測醫療

2019-09-19 16:10:14

人工智能AI

2023-08-11 14:01:35

GPT-4推理

2011-09-17 19:40:57

計算機等級考試

2025-04-03 02:25:00

2009-04-27 13:43:15

軟件設計師沖刺預測題

2011-09-17 19:44:59

計算機等級考試

2011-09-17 19:56:00

計算機等級考試

2011-09-17 19:34:08

計算機等級考試

2011-09-17 19:31:01

計算機等級考試

2011-09-17 20:04:38

計算機等級考試

2024-11-01 11:55:14

2019-07-16 11:13:06

阿里自然語言理解AI

2024-06-11 08:55:00

2023-12-04 13:52:00

模型數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产欧美精品 | 日本视频中文字幕 | 国产精品美女久久久久 | 91av在线免费观看 | 亚洲一区二区av | 欧美久久综合 | 91毛片在线看 | 一区二区三区av | 久久久成人一区二区免费影院 | 波多野结衣亚洲 | 秋霞a级毛片在线看 | 国产精品久久久久久久久久尿 | 亚洲播放一区 | 99精品国产一区二区青青牛奶 | 成人3d动漫一区二区三区91 | 九九免费视频 | 国产精品美女久久久久久不卡 | 精品欧美一区二区三区久久久小说 | 在线一区 | avtt国产 | 天天插天天狠天天透 | 国产精品成人一区二区三区吃奶 | 日韩精品久久久 | 成人在线小视频 | 亚洲国产精品久久久久久 | 91精品国产综合久久久动漫日韩 | 天天操天天干天天透 | 草久在线视频 | 国产精品视频免费观看 | 日本成人在线免费视频 | 久久草在线视频 | 日韩免费av网站 | 欧美精品成人一区二区三区四区 | 懂色av色香蕉一区二区蜜桃 | 一级片在线观看 | 国产精品视频一二三区 | 久久精品亚洲 | 一级黄在线观看 | caoporn免费| 久久精品视频免费观看 | 日韩精品在线看 |