成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI做“軍師”?先贏過(guò)Reddit用戶再說(shuō)吧

新聞 人工智能
日前,西雅圖的研究人員推出了一項(xiàng)被他們稱為“TuringAdvice”的新人工智能大挑戰(zhàn),挑戰(zhàn)的核心是創(chuàng)建語(yǔ)言模型,為使用真實(shí)世界語(yǔ)言的人類提供有用的建議。

 [[322491]]

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請(qǐng)至雷鋒網(wǎng)官網(wǎng)申請(qǐng)授權(quán)。

日前,西雅圖的研究人員推出了一項(xiàng)被他們稱為“TuringAdvice”的新人工智能大挑戰(zhàn),挑戰(zhàn)的核心是創(chuàng)建語(yǔ)言模型,為使用真實(shí)世界語(yǔ)言的人類提供有用的建議。

TuringAdvice挑戰(zhàn)賽是基于動(dòng)態(tài)的RedditAdvice數(shù)據(jù)集而發(fā)起的。Reddit advice是為迎接挑戰(zhàn)而創(chuàng)建的,它是一個(gè)眾包的數(shù)據(jù)集,在過(guò)去兩周里共享的建議在Reddit小組中獲得了最多的支持票。為了通過(guò)挑戰(zhàn),機(jī)器提供的建議必須要與那些受歡迎的人類建議一樣有用,甚至更好。

作為TuringAdvice的一部分,研究人員還發(fā)布了一個(gè)靜態(tài)RedditAdvice 2019數(shù)據(jù)集,用于訓(xùn)練提供建議的人工智能模型,其中包括Reddit子社區(qū)用戶分享的18.8萬(wàn)個(gè)情景下的61.6萬(wàn)條建議。

初步分析表明,像谷歌T5(去年秋天推出的一個(gè)擁有110億個(gè)參數(shù)的模型)這樣的高級(jí)模型,只有在9%的情況下,寫(xiě)建議版主發(fā)現(xiàn)至少和人類建議一樣有用。研究人員還評(píng)估了Grover變壓器模型和TF-IDF的版本。這項(xiàng)研究沒(méi)有評(píng)估像Google的BERT這樣流行的雙向NLP模型,因?yàn)樗鼈兺ǔ1徽J(rèn)為在生成文本方面不如從左到右的模型。關(guān)于人際關(guān)系、法律事務(wù)和日常生活方面的建議,可以在網(wǎng)上找到人機(jī)對(duì)比演示。

最近發(fā)布的一篇關(guān)于TuringAdvice的論文寫(xiě)道:“今天最大的模型在REDDITADVICE上苦苦掙扎,所以我們很高興看到新模型得到發(fā)展。”

“我們認(rèn)為,如今存在一個(gè)深層次的問(wèn)題:人類在現(xiàn)實(shí)世界中如何使用語(yǔ)言,與我們的評(píng)估方法能夠衡量的,這二者之間存在差距。當(dāng)今的主流范式是研究靜態(tài)數(shù)據(jù)集,并根據(jù)輸出結(jié)果與預(yù)先定義正確答案的相似性對(duì)機(jī)器進(jìn)行評(píng)級(jí)。”

“然而,當(dāng)我們?cè)诂F(xiàn)實(shí)世界中使用語(yǔ)言進(jìn)行交流時(shí)——比如提供建議,或向某人傳授一個(gè)概念——很少有一個(gè)通用的正確答案可以與之相比,這只是我們想要實(shí)現(xiàn)的一個(gè)松散的目標(biāo)。我們引入了一個(gè)框架來(lái)縮小基準(zhǔn)測(cè)試和實(shí)際語(yǔ)言使用之間的差距。”

作者們表示,TuringAdvice挑戰(zhàn)賽中的AI進(jìn)展,可能會(huì)使人工智能更好地為人類提供建議或充當(dāng)虛擬治療師。

為了確保結(jié)果與真實(shí)世界的語(yǔ)言使用保持一致,研究小組選擇了一種動(dòng)態(tài)評(píng)估方法,他們?cè)谧罱鼉芍軆?nèi)從Reddit的各個(gè)子社區(qū)收集了200個(gè)情況。他們選擇把建議作為一個(gè)測(cè)試場(chǎng)景,因?yàn)樗撬腥硕挤浅J煜さ臇|西,并且與閱讀理解等核心NLP任務(wù)重疊。

TuringAdvice挑戰(zhàn)是華盛頓大學(xué)和艾倫人工智能研究所(Allen Institute of AI)的工作,上周在arXiv上發(fā)表的一篇研究論文對(duì)此進(jìn)行了詳細(xì)闡述。該論文題為根據(jù)機(jī)器的實(shí)際語(yǔ)言使用情況來(lái)評(píng)估機(jī)器》(evaluation Machines by their Real-World Language Use)。華盛頓大學(xué)副教授Ali Farhadi是艾倫研究所先前團(tuán)隊(duì)的負(fù)責(zé)人,也是本文的合著者之一,他的人工智能初創(chuàng)企業(yè)Xnor最近被蘋果收購(gòu)。

所有的模型性能評(píng)估都來(lái)自于通過(guò)亞馬遜的Mechanical Turk雇傭的人員。這篇論文曾對(duì)獲取人工智能模型培訓(xùn)數(shù)據(jù)的方式表示不滿,但它認(rèn)為,比起發(fā)布自動(dòng)化機(jī)器建議來(lái)回應(yīng)需要幫助的人類,雇傭Mechanical Turk員工的做法更有道德;它也承認(rèn),獲得報(bào)酬來(lái)完成這項(xiàng)任務(wù)會(huì)引入外部動(dòng)機(jī)。傾向于選擇機(jī)器建議而非人類建議的工人被解雇了。

首席研究員Rowan Zellers在采訪中透露,研究人員將有機(jī)會(huì)創(chuàng)建并調(diào)整他們的模型;第二輪排行榜結(jié)果預(yù)計(jì)將在未來(lái)幾個(gè)月內(nèi)公布。

研究人員表示,他們選擇了Reddit各子社區(qū)分享的流行建議,試圖創(chuàng)造一種內(nèi)在的動(dòng)力,就像人們?cè)赗eddit上響應(yīng)求助時(shí)所體驗(yàn)的那樣。

TuringAdvice挑戰(zhàn)賽的一個(gè)關(guān)注點(diǎn)是價(jià)格。評(píng)估200條關(guān)于Mechanical Turk的建議大概需要370美元。未來(lái)挑戰(zhàn)賽的參與者將被要求支付Mechanical Turk的費(fèi)用,以便他們的模型被評(píng)估或出現(xiàn)在TuringAdvice排行榜上。

TuringAdvice是過(guò)去一年中為建立更健壯的自然語(yǔ)言模型而創(chuàng)造的最新挑戰(zhàn)。去年秋天,華盛頓大學(xué)的NLP實(shí)驗(yàn)室曾與紐約大學(xué)、Facebook的AI研究院和三星研究院一道,推出了SuperGLUE挑戰(zhàn)賽和“排行榜”(leaderboard)這一個(gè)更復(fù)雜的評(píng)估性能的任務(wù)系列。

責(zé)任編輯:張燕妮 來(lái)源: 雷鋒網(wǎng)
相關(guān)推薦

2018-03-07 22:22:52

物聯(lián)網(wǎng)技術(shù)矩陣邊緣網(wǎng)絡(luò)

2016-04-13 11:31:32

數(shù)據(jù)分析數(shù)據(jù)獲取大數(shù)據(jù)應(yīng)用

2012-03-21 21:30:11

諾基亞

2020-07-03 07:58:01

開(kāi)源開(kāi)發(fā)軟件

2017-11-03 13:39:49

WOT峰會(huì)

2025-06-06 09:18:17

2017-11-14 11:00:53

程序員

2021-11-02 06:58:53

架構(gòu)線程池參數(shù)

2024-05-07 14:13:46

AI平臺(tái)項(xiàng)目

2025-04-03 15:26:06

2015-04-17 09:11:34

2023-04-25 13:54:07

游戲AI

2021-08-18 15:59:47

蘋果工具系統(tǒng)

2020-02-18 15:53:09

AI 數(shù)據(jù)人工智能

2023-04-19 15:24:19

AI人工智能

2013-08-26 10:48:02

Reddit排名算法算法

2013-02-25 11:04:39

Teradata 大數(shù)據(jù)天睿

2021-03-15 10:10:56

算法AI技術(shù)

2020-02-10 09:23:09

LinuxReddit命令

2023-10-11 07:59:06

Redditmods機(jī)器人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 午夜影院在线观看 | 日韩一区二区视频 | 精品一区二区三区日本 | 日韩欧美在线视频 | 91精品国产综合久久久久久丝袜 | 美女中文字幕视频 | 国产小视频精品 | 国产精品久久久久久久久动漫 | 日韩欧美成人一区二区三区 | 电影午夜精品一区二区三区 | 中文av在线播放 | 午夜精品久久久久久久星辰影院 | 91精品国产乱码久久久 | 国产视频线观看永久免费 | 久久91精品国产一区二区三区 | aaaa网站| 91亚洲国产成人精品一区二三 | 高清黄色 | 国产精品中文字幕在线 | 亚洲午夜精品久久久久久app | 九九热在线观看视频 | 久久中文免费视频 | 久久里面有精品 | 日韩高清国产一区在线 | 欧美黑人国产人伦爽爽爽 | 超黄毛片 | 99久久精品免费看国产高清 | 狠狠色综合久久婷婷 | 爱综合| 午夜影院视频 | 国产一二区免费视频 | 亚洲精品2 | 久久99一区二区 | 国产自产c区 | 在线久草| 97免费在线视频 | 日本三级日产三级国产三级 | 羞羞的视频在线看 | 男人天堂色 | 成人性生交a做片 | www久久 |