成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

KGGen用語言模型從純文本中提取知識圖譜

發布于 2025-2-28 13:12
瀏覽
0收藏

從事大模型應用的讀者都可能受到知識圖譜(KG)不足的困擾,知識圖譜的構建與運營常常是耗時費力的手工過程。

斯坦福最新工作KGGen【文獻1】,利用大語言模型(LLM)從非結構化文本中自動生成高質量知識圖譜,等于從LLM提取出語義。

KGGen用語言模型從純文本中提取知識圖譜-AI.x社區

簡介

知識圖譜是信息檢索等應用中基本的數據結構,通過主謂賓三元組表示實體之間的關系。

然而,許多現有的KG存在不完整性,缺乏實體之間的眾多關系,這對下游任務如KG嵌入和基于圖的推理造成了挑戰。

KGGen通過利用LLM從純文本中提取主謂賓三元組,構建密集且全面的KG,從而緩解數據稀缺和不完整性的問題。

方法

KGGen用語言模型從純文本中提取知識圖譜-AI.x社區

KGGen三步從文本中生成KG:

實體和關系提取:基于LLM的提取器讀取非結構化文本,預測主謂賓三元組,捕捉實體及其關系,并確保實體之間的一致性。

聚合:從每個源文本中提取三元組后,收集所有源圖中的所有唯一實體和邊,將其組合成一個整體圖Graph。聚合無需LLM。

相關實體聚類:為減少提取的KG中的稀疏性,對相關實體進行聚類,確保生成的圖是密集且相互關聯的。靈感來自人群如何逐漸就合并術語達成一致。

這種多步方法使KGGen能夠從純文本中生成高質量的KG,成為下游各種應用的非常有價值工具。

基準測試和性能

KGGen用語言模型從純文本中提取知識圖譜-AI.x社區

為了評估KGGen的有效性,學者們引入了節點和邊信息度量(MINE)基準測試。

MINE通過確定特定事實是否被捕捉到生成的圖中,評估提取器從純文本生成有用KG的能力。

KGGen在該基準測試中優于現存的提取器,展示了其利用LLM生成功能性KG的潛力。

KGGen用語言模型從純文本中提取知識圖譜-AI.x社區

可用性

KGGen作為Python庫提供,用戶可以通過pip(pip install kg-gen)訪問。

該項目的代碼可以在??https://github.com/stair-lab/kg-gen??找到,可促進KGGen在各種應用和研究項目中的集成。

結論

KGGen用語言模型從純文本中提取知識圖譜-AI.x社區

KGGen的開發代表了從非結構化文本中自動生成知識圖譜的重大進展。

通過利用LLM和聚類算法,KGGen解決了傳統KG中數據稀缺和不完整性的問題。

其在MINE基準測試中的優異表現和作為開源Python庫的可用性,可作為知識圖譜構建和利用領域從業者的寶貴資源。

文獻1,KGGen: Extracting Knowledge Graphs from Plain Text with Language Models,https://arxiv.org/pdf/2502.09956v1

本文轉載自??清熙??,作者: 王慶法 


已于2025-2-28 14:11:54修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 久久天天躁狠狠躁夜夜躁2014 | 久久国产一区二区 | 在线观看国产视频 | av毛片在线播放 | 久久久久国产精品一区二区 | 奇米久久久 | 午夜在线视频一区二区三区 | 天天天插| 欧美综合精品 | 99re在线播放 | 天天躁日日躁狠狠很躁 | 国内91在线| 成人片免费看 | 国产伦一区二区三区 | 久久久久久久久久久久久久国产 | 国产欧美日韩精品一区二区三区 | 日本久久久久久久久 | 成人精品国产免费网站 | 久久夜视频 | 自拍偷拍小视频 | 国产精品久久 | 96国产精品久久久久aⅴ四区 | 天天操欧美| 日日做夜夜爽毛片麻豆 | 91在线看| 一级女毛片 | 亚洲精选一区二区 | 精品国产黄a∨片高清在线 成人区精品一区二区婷婷 日本一区二区视频 | 一级片视频免费 | 男女羞羞视频免费 | 欧美一区二区三区在线观看 | 欧美不卡一区二区 | 成人高清在线视频 | 欧美色图综合网 | 国产欧美性成人精品午夜 | 亚洲一区二区精品视频 | www国产成人 | 中文字幕一区二区三区精彩视频 | 精品亚洲一区二区 | av毛片 | 国产午夜在线 |