成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

終于不瞎編了!AI學會“谷歌一下”,Q&A正確率達90%

人工智能 新聞
讓模型像人類一樣,學會“谷歌一下”,回答問題同時還能給出論據(jù)。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。

語言模型總是給出“驢唇不對馬嘴”的答案,已經(jīng)成為它最飽受詬病的問題之一。

現(xiàn)在,DeepMind想到了一個解決辦法——

讓模型像人類一樣,學會“谷歌一下”,回答問題同時還能給出論據(jù)

這個模型名叫GopherCite,當你問它:

GopherCite是如何找到論據(jù)來源的?

它會回答:

通過谷歌搜索檢索相關文檔。

同時還給出了答案的依據(jù),援引自DeepMind發(fā)布這項研究的頁面。

而且遇到實在不懂的問題,它還會說“I don’t know.”,不會強行給一個錯誤答案。

訓練結果顯示,該模型在自然問題數(shù)據(jù)集、ELI5數(shù)據(jù)集上的正確率分別可以達到90%80%,接近人類水平。

用強化學習訓練AI查谷歌

首先我們來看一下GopherCite的效果如何。

當被問道:

在Scooby Doo中,Scooby是什么動物?

GopherCite回答道:

一只大丹犬。

摘自維基百科Scooby-Doo。這是周六早上播出的系列青少年動畫片,主角包括弗雷德·瓊斯等,以及一只名叫Scooby-Doo、會說話的大丹犬。

不難看出,在學會找論據(jù)后,AI給出的回答靠譜多了。

事實上,GopherCite的前輩——超大語言模型Gopher,此前回答問題時的表現(xiàn)就要差勁很多。

Gopher是DeepMind在去年年底發(fā)布的NLP模型,包含2800億參數(shù)。

它基于Transformer架構,在10.5TB大小的MassiveText語料庫上進行訓練。

在這里,DeepMind舉了一個例子來說明。

讓Gopher和GopherCite回答同一個問題:

普萊西德湖一共舉辦過幾次冬奧會?

Gopher回答(是錯的):

普萊西德湖在1932年、1936年、1980年舉辦過冬奧會。

但GopherCite就答對了:

兩次。

并給出了嚴謹?shù)睦碛桑?/span>

援引自美國主辦奧運會城市史。1932年、1980年在普萊西德湖舉辦過冬季奧運會;1936年、1984年在洛杉磯舉辦過夏季奧運會。

那么GopherCite的具體工作原理是怎樣的呢?

在Gopher的基礎上,研究人員開發(fā)了一種獎勵機制,也就是用上強化學習

在收到問題后,模型會訪問谷歌搜索的API來找到相關的網(wǎng)頁,獲取top-K結果。

(top-K操作,即從分數(shù)集合中找到k個最大或最小元素,是一個重要的機器學習模型組件,被廣泛用于信息檢索和數(shù)據(jù)挖掘中。)

然后它會根據(jù)問題來生成一些答案,答案數(shù)量N會大于K。

這些答案同時會帶有自己的證據(jù),即從網(wǎng)頁上搜索到的包含答案的文段。

接下來,系統(tǒng)會對這些答案進行打分,最終輸出得分最高的答案。

在推理過程中,模型采樣會按照循環(huán)在文檔上不斷迭代,每個循環(huán)都會從單個文檔中盡可能多地顯示上下文內(nèi)容,然后對文本重新排序并返回給上一步。

此外,這個模型還會計算最終生成答案的質(zhì)量,如果生成答案太差,它就會選擇不回答。

這是源于紅牛的廣告語:“它會給你翅膀”。

在ELI5Filtered數(shù)據(jù)集上回答70%的問題時,正確率為80%左右。

DeepMind表示這種訓練模式和LaMDA有些類似。

LaMDA是谷歌在去年I/O大會上發(fā)布的一個對話模型,它能夠在“聽懂”人類指令的基礎上,對答如流并保證邏輯、事實正確。

不同的是,LaMDA有時會直接給人分享問題的相關鏈接,而GopherCite可以直接摘出相關論據(jù)文段。

另外,OpenAI最近也開發(fā)了一個網(wǎng)頁版GPT (WebGPT),同樣也是用類似的方法來校正GPT-3。

DeepMind表示,WebGPT是通過多次訪問網(wǎng)頁來組織答案,GopherCite則是側重于讀取長文段。

還是會有失誤

雖然懂得援引資料了,但是GopherCite有時還是會生搬硬套。

比如當你問它“喝了紅牛會怎么樣?”,它的回答是“翅膀”。

這是源于紅牛的廣告語:“它會給你翅膀”。

顯然讓它理解比喻還是有點困難……

也有網(wǎng)友吐槽說,可能人類自己去谷歌搜索會更快。

你覺得呢?

責任編輯:張燕妮 來源: 量子位
相關推薦

2016-12-02 20:10:22

人工智能唇語序列

2018-11-14 10:01:30

谷歌開源機器學習

2010-05-10 14:11:41

負載均衡算法

2022-06-28 14:01:42

MITOpenAI預訓練模型

2010-05-25 17:57:24

VoIP網(wǎng)絡電話

2011-01-24 15:46:30

金山網(wǎng)絡T盤T盤

2024-04-01 07:00:00

模型AI

2021-06-10 14:05:47

AI 芯片人工智能

2018-05-09 13:22:40

谷歌開發(fā)者大會新品兩點

2022-06-23 11:54:35

AI智能代碼

2010-03-16 10:45:37

家庭無線WLAN技術

2010-04-01 16:18:55

無線上網(wǎng)卡流量

2019-10-22 15:19:27

AI 數(shù)據(jù)人工智能

2025-06-23 15:22:21

斯坦福不等式AI

2023-05-09 08:25:26

Gaussdb數(shù)據(jù)庫開源數(shù)據(jù)庫

2020-02-06 15:20:21

編程語言PythonJava

2025-01-26 09:45:00

2023-06-28 13:49:12

AI人工智能

2023-02-08 09:02:05

VS Code摸魚神器

2018-12-04 22:00:26

人工智能機器人醫(yī)學診斷
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品视频免费播放 | 国产一级一级毛片 | 国产精品夜夜春夜夜爽久久电影 | 亚洲欧美中文日韩在线v日本 | 91超碰在线观看 | www.一级片 | 一级片在线视频 | 久久这里只有精品首页 | 国产一级免费视频 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 | 久久国内精品 | 亚洲第一色av | 欧美日本久久 | 欧美一级片在线 | 蜜桃视频一区二区三区 | 成人在线观看免费 | 久久国产日韩欧美 | 在线中文字幕国产 | 米奇狠狠鲁| 日韩欧美在线视频一区 | 在线免费观看色 | 国产激情91久久精品导航 | 天天激情综合 | 成人深夜福利网站 | 日本久久久一区二区三区 | 国产一区二区免费电影 | 精品欧美久久 | 琪琪午夜伦伦电影福利片 | 九九在线视频 | 国产精品欧美一区二区三区不卡 | 欧美激情综合色综合啪啪五月 | 色视频在线播放 | 欧美日韩在线免费观看 | 国产视频一区二区三区四区五区 | 国产免费一区二区 | 一区二区精品在线 | va精品| 久久久久国产一区二区三区 | 91在线观看 | 久青草影院| 伊人超碰在线 |