成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

新聞 人工智能 知識(shí)圖譜
他們做了個(gè)名為TEKGEN的AI模型,直接將知識(shí)圖譜用“人話”再描述一遍,生成語(yǔ)料庫(kù),再喂給NLP模型訓(xùn)練。

 本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

還在擔(dān)心大語(yǔ)言模型“啥都吃”,結(jié)果被用假信息訓(xùn)練了?

放在以前,這確實(shí)是訓(xùn)練NLP模型時(shí)值得擔(dān)心的一個(gè)難題。

現(xiàn)在,谷歌從根本上解決了這個(gè)問題。

他們做了個(gè)名為TEKGEN的AI模型,直接將知識(shí)圖譜用“人話”再描述一遍,生成語(yǔ)料庫(kù),再喂給NLP模型訓(xùn)練。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

這是因?yàn)椋R(shí)圖譜的信息來源往往準(zhǔn)確靠譜,而且還會(huì)經(jīng)過人工篩選、審核,質(zhì)量有保障

目前,這項(xiàng)研究已經(jīng)被NAACL 2021接收。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

如何讓AI用“人話”描述知識(shí)圖譜?

谷歌用來描述知識(shí)圖譜的TEKGEN模型,全名Text from KG Generator(知識(shí)圖譜文本生成器)。

它會(huì)讀取一個(gè)知識(shí)圖譜中的所有詞語(yǔ),捋清它們之間的關(guān)系,再用“人話”說出來。

從下圖中來看,轉(zhuǎn)換語(yǔ)句分為2步:

首先,將關(guān)系圖譜中的詞語(yǔ),按邏輯進(jìn)行排列;然后,再添加一些詞語(yǔ)、并調(diào)整語(yǔ)句間的邏輯關(guān)系,將它們變成一段完整的話。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

為了實(shí)現(xiàn)這個(gè)功能,TEKGEN包含4個(gè)部分:

  • 三元組(包含主語(yǔ)、賓語(yǔ)、關(guān)系詞)生成器。將維基百科的知識(shí)圖譜、和維基百科文本描述進(jìn)行對(duì)應(yīng),生成訓(xùn)練數(shù)據(jù)集。
  • T5的文本-文本生成器,用于將三元組轉(zhuǎn)換成文本信息。
  • 實(shí)體子圖創(chuàng)建器。用于將三元組中的文本信息轉(zhuǎn)換成語(yǔ)句。
  • 語(yǔ)義質(zhì)量濾波器。這部分用來處理低質(zhì)量的輸出,保證生成的語(yǔ)句質(zhì)量。
擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

整體來看,用TEKGEN生成語(yǔ)句的流程是這樣的:

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

生成后的語(yǔ)句,就能用來放心地訓(xùn)練大語(yǔ)言模型了。

這份生成的語(yǔ)料庫(kù),由4500萬個(gè)三元組生成,組合起來的句子有1600萬句。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

那么,用這個(gè)語(yǔ)料庫(kù)訓(xùn)練的NLP模型,是否真能取得更好的效果呢?

“滿分5分,人類給它4.3分”

先來看幾個(gè)連詞成句的實(shí)例效果。

從輸入的詞語(yǔ)來看,只有主語(yǔ)、賓語(yǔ),以及這兩個(gè)詞語(yǔ)之間的關(guān)系。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

但TEKGEN似乎“”出了什么,很快就將這些句子組合成了一段正常的語(yǔ)句。

不僅時(shí)間、地點(diǎn)、從屬關(guān)系等分得非常清楚,邏輯上也符合我們平時(shí)說話的語(yǔ)序。

那么,滿分5分的話,人類對(duì)于AI的“圖文轉(zhuǎn)換”能力給出幾分呢?

谷歌找了些志愿者來進(jìn)行測(cè)評(píng),從結(jié)果來看,TEKGEN在“語(yǔ)義”和“流暢度”兩方面,均取得了4.3分以上的好成績(jī)。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

當(dāng)然,這里面也用LAMA(LAnguage Model Analysis) probe,來對(duì)用這個(gè)語(yǔ)料庫(kù)訓(xùn)練的模型進(jìn)行了評(píng)估。

在Google-RE和TREx兩個(gè)數(shù)據(jù)集上,經(jīng)過預(yù)訓(xùn)練的模型,在各項(xiàng)任務(wù)上均取得了非常好的效果。

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

說不定,將來真能讓AI去試試高考語(yǔ)文的“圖文轉(zhuǎn)換”題:

擔(dān)心GPT-3被喂假消息?谷歌新研究,將知識(shí)圖譜轉(zhuǎn)“人話”來訓(xùn)練

作者介紹

[[403766]]

論文一作小姐姐Oshin Agarwal,是賓夕法尼亞大學(xué)的計(jì)算機(jī)系在讀博士生,研究方向是自然語(yǔ)言處理中的信息抽取。

這篇論文,是她在谷歌實(shí)習(xí)期間完成的。

來自谷歌的Heming Ge、Siamak Shakeri和Rami Al-Rfou也參與了這項(xiàng)工作。

目前,作者們已經(jīng)將這個(gè)用知識(shí)圖譜生成的語(yǔ)料庫(kù)放了出來。

想要訓(xùn)練NLP模型的小伙伴,可以用起來了~

論文地址:
https://arxiv.org/abs/2010.12688

用知識(shí)圖譜生成的語(yǔ)料庫(kù):
https://github.com/google-research-datasets/KELM-corpus

 

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2017-03-06 16:48:56

知識(shí)圖譜構(gòu)建存儲(chǔ)

2025-04-27 00:10:00

AI人工智能知識(shí)圖譜

2021-01-19 10:52:15

知識(shí)圖譜

2023-08-22 15:34:01

Python開發(fā)

2023-09-11 08:12:39

圖形結(jié)構(gòu)圖譜

2021-03-23 15:21:00

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-01-25 10:36:32

知識(shí)圖譜人工智能

2020-01-08 09:31:58

知識(shí)圖譜互聯(lián)網(wǎng)

2024-06-03 07:28:43

2025-06-06 01:00:00

AI人工智能知識(shí)圖譜

2022-05-27 17:10:51

知識(shí)圖譜谷歌

2017-04-13 11:48:05

NLP知識(shí)圖譜

2017-05-04 13:18:18

深度學(xué)習(xí)知識(shí)圖譜

2019-05-07 10:01:49

Redis軟件開發(fā)

2021-02-01 22:41:05

語(yǔ)義網(wǎng)知識(shí)圖譜

2021-01-18 10:50:29

知識(shí)圖譜人工智能深度學(xué)習(xí)

2019-01-18 16:02:33

知識(shí)圖譜圖數(shù)據(jù)庫(kù)AI

2025-06-03 06:03:06

2025-06-03 15:00:04

2025-06-05 09:09:50

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 97在线观视频免费观看 | 午夜影院在线观看 | 中文字幕 在线观看 | 精品亚洲一区二区三区 | 狠狠做六月爱婷婷综合aⅴ 国产精品视频网 | h片在线免费观看 | 黄色免费观看 | 欧美黄色片 | 青娱乐av | 小早川怜子xxxxaⅴ在线 | 国产不卡视频 | 欧美成人免费在线 | 国产天堂| 亚洲精品一区二区三区四区高清 | 老外黄色一级片 | 久久久久综合 | 亚洲成人一级 | 国产精品色 | 国产精品精品 | 青青草一区二区 | 精品三级| 日本在线一区二区 | 国产免费一区二区三区网站免费 | 亚洲va欧美va天堂v国产综合 | 欧美精品一区二区三区四区 在线 | chinese中国真实乱对白 | 99re热精品视频国产免费 | 亭亭五月激情 | 韩国久久精品 | 国产一区二区三区在线看 | 天天干天天操 | 精品一区二区免费视频 | 国产wwwcom| 婷婷开心激情综合五月天 | 国产日韩欧美二区 | 成人av资源在线 | 在线国产精品一区 | 久久夜视频 | 国产午夜视频 | 日韩福利 | 一级毛片免费看 |