成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

PubMedBERT:生物醫學自然語言處理領域的特定預訓練模型

人工智能
今年大語言模型的快速發展導致像BERT這樣的模型都可以稱作“小”模型了。Kaggle LLM比賽LLM Science Exam 的第四名就只用了deberta,這可以說是一個非常好的成績了。

今年大語言模型的快速發展導致像BERT這樣的模型都可以稱作“小”模型了。Kaggle LLM比賽LLM Science Exam 的第四名就只用了deberta,這可以說是一個非常好的成績了。所以說在特定的領域或者需求中,大語言模型并不一定就是最優的解決方案,“小”模型也有一定的用武之地,所以今天我們來介紹PubMedBERT,它使用特定領域語料庫從頭開始預訓練BERT,這是微軟研究院2022年發布在ACM的論文。

論文的主要要點如下:

對于具有大量未標記文本的特定領域,如生物醫學,從頭開始預訓練語言模型比持續預訓練通用領域語言模型效果顯著。提出了生物醫學語言理解與推理基準(BLURB)用于特定領域的預訓練。

PubMedBERT

1、特定領域Pretraining

研究表明,從頭開始的特定領域預訓練大大優于通用語言模型的持續預訓練,從而表明支持混合領域預訓練的主流假設并不總是適用。

2、模型

使用BERT。對于掩碼語言模型(MLM),全詞屏蔽(WWM)強制要求整個詞必須被屏蔽。

3、BLURB數據集

據作者介紹,BLUE[45]是在生物醫學領域創建NLP基準的第一次嘗試。但BLUE的覆蓋范圍有限。針對基于pubmed的生物醫學應用,作者提出了生物醫學語言理解與推理基準(BLURB)。

PubMedBERT使用更大的特定領域語料庫(21GB)。

結果展示

在大多數生物醫學NLP任務中,PubMedBERT始終優于所有其他BERT模型,并且通常具有顯著的優勢。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2022-09-30 15:28:05

BERT語言模型自然語言

2017-05-05 15:34:49

自然語言處理

2014-08-21 09:16:45

生物醫學

2021-09-03 12:01:07

模型自然語言

2018-02-27 09:32:13

神經網絡自然語言初探

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-06-11 07:40:00

2022-04-22 09:00:00

自然語言處理HMMCRF

2017-10-19 17:05:58

深度學習自然語言

2022-04-11 09:30:00

自然語言HMM深度學習

2018-04-04 12:00:00

2024-04-24 11:38:46

語言模型NLP人工智能

2021-06-23 15:45:55

神經網絡AI算法

2024-02-05 14:18:07

自然語言處理

2021-05-17 09:00:00

自然語言人工智能技術

2020-08-10 15:25:00

人工智能機器學習技術

2017-04-17 15:03:16

Python自然語言處理

2025-05-28 01:50:00

2010-01-27 10:11:44

曙光超算HPC
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av中文字幕在线 | 91看片在线观看 | 一区二区三区四区日韩 | 一区二区三区日韩 | 狠狠干2020| 天天夜干 | 国产乱码精品一区二区三区中文 | 99福利在线观看 | a视频在线观看 | 狠狠骚| 亚洲高清视频在线 | 91av亚洲| 欧美久久久网站 | 97伦理电影| 成人h视频在线观看 | 成人高清在线 | 久久一区视频 | 97精品久久| 久久国内精品 | 福利视频网站 | 久久精品中文字幕 | 一区二区三区久久久 | 黄色成人av| 亚洲精品日韩视频 | 日本精品一区二区 | 91免费电影 | 亚洲综合视频一区 | 高清黄色| 人人爱干 | 伊人精品久久久久77777 | 国产精品久久久99 | 亚洲 中文 欧美 日韩 在线观看 | 黄色一级片在线播放 | 日韩在线观看网站 | www四虎影视 | 亚洲精品久久久久久久久久久久久 | 成人不卡视频 | 日韩精品 电影一区 亚洲 | 一区在线观看 | 国产精品1区2区3区 国产在线观看一区 | 69av在线视频 |