成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="om4sk"><code id="om4sk"></code></abbr>

<abbr id="om4sk"></abbr>

<bdo id="om4sk"><dd id="om4sk"></dd></bdo>

<strike id="om4sk"><source id="om4sk"></source></strike>

<s id="om4sk"><dd id="om4sk"></dd></s>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Meta AI 多語(yǔ)言閱讀理解數(shù)據(jù)集 Belebele，涵蓋 122 種語(yǔ)言變體

2023-09-04 19:19:36

開(kāi)發(fā) 前端

研究人員利用這個(gè)數(shù)據(jù)集評(píng)估了多語(yǔ)言屏蔽語(yǔ)言模型（MLM）和大語(yǔ)言模型（LLM）的能力。結(jié)果表明，盡管以英語(yǔ)為中心的 LLM 有顯著的跨語(yǔ)言遷移能力，但在平衡的多語(yǔ)言數(shù)據(jù)上經(jīng)過(guò)預(yù)訓(xùn)練的更小的 MLM 仍然能理解更多的語(yǔ)言。

Meta AI 宣布推出一款涵蓋 122 種語(yǔ)言變體的多語(yǔ)言閱讀理解數(shù)據(jù)集，名為 Belebele。“我們希望這項(xiàng)工作能夠引發(fā)圍繞 LLM 多語(yǔ)言性的新討論”。

BELEBELE 是首個(gè)跨語(yǔ)言并行數(shù)據(jù)集，可以直接比較所有語(yǔ)言的模型性能。該數(shù)據(jù)集涵蓋了 29 種腳本和 27 個(gè)語(yǔ)系中不同類型的高、中、低資源語(yǔ)言。此外，還有 7 種語(yǔ)言包含在兩種不同的腳本中，從而為印地語(yǔ)、烏爾都語(yǔ)、孟加拉語(yǔ)、尼泊爾語(yǔ)和僧伽羅語(yǔ)的羅馬化變體制定了首個(gè) NLP 基準(zhǔn)。

該數(shù)據(jù)集可對(duì)單語(yǔ)和多語(yǔ)模型進(jìn)行評(píng)估，但其并行性也可在一些跨語(yǔ)言環(huán)境中對(duì)跨語(yǔ)言文本表征進(jìn)行評(píng)估。通過(guò)從相關(guān)質(zhì)量保證數(shù)據(jù)集中收集訓(xùn)練集，可以對(duì)任務(wù)進(jìn)行全面微調(diào)評(píng)估。每個(gè)問(wèn)題都基于 Flores-200 數(shù)據(jù)集中的一段短文，并有四個(gè)多項(xiàng)選擇答案。這些問(wèn)題經(jīng)過(guò)精心設(shè)計(jì)，以區(qū)分具有不同一般語(yǔ)言理解水平的模型。

每種語(yǔ)言有 900 道題
488 個(gè)不同段落，每個(gè)段落有 1-2 道相關(guān)問(wèn)題。
每道題有 4 個(gè)選擇答案，其中只有一個(gè)是正確的。
122 種語(yǔ)言 / 語(yǔ)言變體（包括英語(yǔ)）。
900 x 122 = 109,800 個(gè)問(wèn)題。

研究人員利用這個(gè)數(shù)據(jù)集評(píng)估了多語(yǔ)言屏蔽語(yǔ)言模型（MLM）和大語(yǔ)言模型（LLM）的能力。結(jié)果表明，盡管以英語(yǔ)為中心的 LLM 有顯著的跨語(yǔ)言遷移能力，但在平衡的多語(yǔ)言數(shù)據(jù)上經(jīng)過(guò)預(yù)訓(xùn)練的更小的 MLM 仍然能理解更多的語(yǔ)言。且詞匯量越大、越有意識(shí)地構(gòu)建詞匯，在低資源語(yǔ)言上的表現(xiàn)就越好。

責(zé)任編輯：武曉燕來(lái)源： OSCHINA

語(yǔ)言模型 LLM

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：日韩精品视频在线免费观看 | 亚洲美女一区二区三区 | 在线观看第一页 | 九九九精品视频 | 日韩三区 | 精品欧美一区免费观看α√ | 国产综合精品一区二区三区 | 亚洲一区二区三区久久久 | 欧美在线视频网 | 久久久91精品国产一区二区精品 | 91欧美精品成人综合在线观看 | 久久久久国产 | 日本一区二区高清视频 | 一区二区在线观看免费视频 | 偷拍自拍网 | 欧美日韩一区二区三区不卡视频 | 午夜视频在线免费观看 | 国产丝袜一区二区三区免费视频 | 免费午夜电影 | 亚洲福利一区 | 成人免费视频网站在线看 | 福利视频三区 | 欧美日韩精品一区二区三区视频 | 亚洲国产精品99久久久久久久久 | 成人影院一区二区三区 | 男女羞羞的网站 | 手机在线不卡av | 天天操天天舔 | 一区二区三区不卡视频 | 人人操日日干 | 日韩欧美综合在线视频 | 欧美网站一区二区 | 欧美爱爱视频网站 | 国精产品一区二区三区 | 成人精品一区二区三区中文字幕 | 亚洲一二视频 | 色小姐综合网 | 一区二区视频在线 | 国产精品久久久久久一区二区三区 | 欧美午夜精品久久久久久浪潮 | 中文字幕亚洲区一区二 |

<td id="iokk4"><option id="iokk4"></option></td>

<s id="iokk4"><dd id="iokk4"></dd></s>

<table id="iokk4"></table>