成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺談圖嵌入算法

人工智能 機器學習
圖作為一種重要的數據表示形式,普遍存在于多樣化的實際場景中,如社交網絡中的社交圖、電子商務網站中的用戶興趣圖、科研領域中的論文引文圖等。有效的圖分析能夠幫助人們深入了解數據背后的內容,從而解決節點分類、節點聚類、鏈路預測等問題。然而圖上的數學和統計操作是有限的,將機器學習方法直接應用到圖上是很有挑戰性的。在這種情況下,圖嵌入似乎是一個合理的解決方案。

Part 01

  什么是圖嵌入 ● 

圖嵌入是將圖結構數據映射為低維稠密向量的過程,同時使得原圖中拓撲結構相似或屬性接近的節點在向量空間上的位置也接近,能夠很好地解決圖結構數據難以高效輸入機器學習算法的問題。

對于圖的表示和存儲,最容易想到的是使用鄰接矩陣的方式。對圖中的每個節點進行編號,構造出一個圖片的矩陣,其中圖片表示圖中節點的數量。圖中任意兩個節點是否有邊相連決定了鄰接矩陣中對應位置的值,這種表示方法非常容易理解且直觀,但是非常低效。因為現實場景中的圖可能會包含成千上萬甚至更多的節點,而大多數節點之間是沒有邊連接的,這會導致得到的鄰接矩陣十分稀疏。使用鄰接矩陣表示和存儲圖需要較高的計算成本和空間成本,而圖嵌入算法能夠高效解決圖分析問題。

Part 02

  基本概念 ● 

概念1 圖:

圖表示為圖片,其中圖片表示節點,圖片表示邊。圖片與節點類型映射函數圖片和邊類型映射函數圖片相關聯。圖片表示節點類型的集合,圖片表示邊類型的集合。

概念2 同構圖:

圖片,其中圖片。也就是說,所有節點都屬于一種類型,所有邊都屬于一種類型,比如社交網絡中的用戶關注關系圖,只有用戶這一種節點類型和關注關系這一種邊類型。

概念3 異構圖:

圖片,其中圖片圖片。也就是說,節點類型或邊類型多于一種,比如學術網絡中的圖結構,存在論文、作者、會議等多種節點類型,邊的關系包括作者與論文之間的創作關系、論文與會議之間的發表關系、論文與論文之間的引用關系等。

概念4 一階相似度:

如果連接兩個節點的邊的權重較大,則它們之間的一階相似度越大。節點圖片和節點圖片之間的一階相似度表示為圖片,有圖片,其中圖片是節點圖片和節點圖片之間連邊圖片的權重。

概念5 二階相似度:

如果兩個節點鄰近的網絡結構越相似,則它們之間的二階相似度越大。節點圖片和節點圖片之間的二階相似度圖片圖片的鄰域圖片圖片的鄰域圖片之間的相似性。如圖1所示,因為有邊連接節點f和節點g,所以節點f和節點g一階相似。雖然沒有邊連接節點e和節點g,但是它們相同的鄰居節點有四個,所以節點e和節點g二階相似。


圖片

圖1 二階相似度示意圖

概念6 圖嵌入:

給定輸入圖,以及預定義的嵌入維數,圖嵌入是要在盡可能保留圖屬性的前提下,將圖轉換到維空間。依賴一階相似度或高階相似度量化圖屬性的保留程度,使用一個維向量或一組圖片維向量來表示一個圖,每個向量表示圖的一部分的嵌入,例如節點或邊。

Part 03

  圖嵌入算法分類 ● 

?在過去幾十年,研究人員們提出了許多優秀的算法,在社交網絡、通信網絡等場景中被證明具有顯著的效果。業界通常根據輸出粒度的差異將這些圖嵌入算法分為以下三類:

(1)節點嵌入

節點嵌入是最常見的類型,在低維空間中用向量對圖中的每一個節點進行表示,“相似”節點的嵌入向量表示也是相似的。當需要對圖中的節點進行分析,進而執行節點分類或節點聚類等任務時,通常會選擇節點嵌入。

(2)邊嵌入

在低維空間中用向量對圖中的每一條邊進行表示。邊由一對節點組成,通常表示節點對關系。當需要對圖中的邊進行分析,執行知識圖譜關系預測或鏈路預測等任務時,適合選擇邊嵌入。

(3)圖嵌入

在低維空間中用向量對整個圖進行表示,通常是分子或蛋白質這樣的小圖。將圖表示為一個向量便于計算不同圖之間的相似性,從而解決圖分類問題。

不同的任務需求決定了選用的圖嵌入算法,由于篇幅原因,這里節選出節點嵌入中的DeepWalk算法和Node2Vec算法來進行相對詳細的學習。

Part 04

  經典圖嵌入算法 ● 

1.DeepWalk算法?

受自然語言處理領域中word2vec思想的啟發,Perozzi等為了建立學習圖中節點表示向量的模型,將節點與節點的共現關系類比于語料庫中詞與詞的共現關系,提出了DeepWalk算法。通過隨機游走的方式采集圖中節點的鄰居節點序列,相當于節點上下文的語料庫,進而可以解決圖中節點之間共現關系的提取問題。預先設置好節點序列的長度和起點,隨機游走策略將會指導如何在鄰居節點中確定下一個游走節點,重復執行該步驟,即可獲得滿足條件的序列,隨機游走示意圖如圖2所示。


圖片

圖2 隨機游走示意圖

將word2vec算法中的單詞對應成圖中的節點圖片,單詞序列對應成隨機游走得到的節點序列,那么對于一個隨機游走圖片,定義其優化目標函數如公式所示。

圖片

為了更進一步學習節點的潛在特征表示,DeepWalk算法引入了映射函數圖片,實現圖中節點到圖片維向量的映射,那么問題就轉換成要估算下列公式的可能性。

圖片

概率的計算同樣需要參考word2vec算法中的skip-gram模型。

如圖3所示,skip-gram模型包含兩個關鍵的矩陣,一個是中心詞向量矩陣圖片,另一個是背景詞向量矩陣圖片,這兩個權重矩陣分別代表著作為不同角色時單詞所關聯的詞向量。skip-gram是一個預測詞上下文的模型,先從語料庫中學習了詞與詞之間的關系,再用這些關系來表達一個特定詞的上下文,即詞的向量表示。也就是說,在同一個序列中,兩個單詞同時出現的頻率越高,兩個單詞的向量表示越相似。將這個思想應用到圖中,定義其優化目標函數如公式所示。

圖片

在隨機游走過程中,不考慮采樣序列中節點與節點的順序關系,這能夠更好地反映節點的鄰近關系,同時減少了計算成本。

圖片

圖3 skip-gram模型示意圖

2.Node2Vec算法

在DeepWalk算法的基礎上,研究者Grover A和Leskovec J提出了Node2Vec算法。Node2Vec算法對DeepWalk算法中通過隨機游走生成節點序列的過程進行優化,定義參數圖片和參數圖片對每次隨機游走是傾向于廣度優先采樣還是深度優先采樣進行引導,因此適應性很高。假定當前訪問節點圖片,則下一個訪問節點圖片的概率如公式所示。

圖片

式中圖片表示從節點圖片到節點圖片的轉移概率,圖片表示歸一化常數。


圖片

圖4 Node2Vec隨機游走策略示意圖

Node2Vec的隨機游走策略是根據兩個參數進行控制的,如圖4所示。假設經過邊圖片到達節點v,下一步準備訪問節點x,設圖片圖片是節點圖片圖片之間的邊權。也就是說,當圖是無權圖時,圖片直接決定了節點的轉移概率。當圖是有權圖時,圖片與邊權重的乘積圖片決定了節點最終的轉移概率。圖片可以根據以下公式來計算,式中圖片是節點圖片和節點圖片之間的最短路徑距離。

當游走采樣從節點圖片走到節點圖片并需要選擇下一跳節點時,會有以下三種情況。

(1) 當圖片時,返回節點圖片

(2) 當圖片時,選擇節點圖片和節點圖片的共同鄰接節點,例如節點圖片

(3) 當圖片時,選擇與節點圖片無關的節點圖片的鄰接節點,例如節點圖片圖片

也就是說,參數圖片控制著返回上一跳節點的概率,參數圖片更多地控制的是探索網絡的局部結構信息還是全局結構信息,DeepWalk模型其實是圖片圖片的值設置為1時的Node2Vec模型。

Part 05

  總結 ● 

隨著信息技術的快速發展,網絡環境變得日益復雜,網絡攻擊頻發,其中APT攻擊呈高發態勢,是企業需要關注的安全問題。事實上,APT攻擊發生的基本環境——網絡,本身就是一個由計算機等元素構成的網絡結構,這也不難聯想到使用圖數據結構來表達這些元素間的關系,再將攻擊檢測問題轉化為圖中的節點、邊或子圖分類任務。圖嵌入是一個豐富且極具研究空間的問題,如何提高模型訓練效率、創新模型構造方法、將圖嵌入的思想應用于更多的生產實踐,企業需要通過更進一步的研究,才能找到更好的答案。

參考文獻

[1]Xu M. Understanding graph embedding methods and their applications[J]. SIAM Review, 2021, 63(4): 825-853.

[2]Cai H, Zheng V W, Chang K C C. A comprehensive survey of graph embedding: Problems, techniques, and applications[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(9): 1616-1637.

[3]Goyal P, Ferrara E. Graph embedding techniques, applications, and performance: A survey[J]. Knowledge-Based Systems, 2018, 151: 78-94.

責任編輯:龐桂玉 來源: 移動Labs
相關推薦

2011-04-18 11:34:34

嵌入式軟件測試

2009-07-14 11:51:00

XML壓縮

2023-10-16 19:05:20

2010-03-26 11:23:59

無線嵌入式控制技術

2022-11-10 15:25:09

機器學習Python圖嵌入

2019-04-16 11:02:10

TCPIPLinux

2009-12-22 17:46:56

Fedora 9嵌入式

2021-11-05 22:47:44

冒泡排序選擇插入

2021-09-04 16:12:33

壓縮算法數據

2020-02-13 17:27:31

CAPPaxos 共識算法

2011-05-16 16:41:06

軟件測試單元測試

2012-09-28 14:08:20

大型網站架構大型網站算法算法

2017-03-20 10:14:03

語音識別匹配算法模型

2022-03-10 08:59:59

傅里葉變換算法系統

2020-11-04 10:20:56

嵌入式算法CRC

2011-12-28 09:11:03

甘特圖

2011-12-22 11:22:31

2012-10-09 13:53:33

大型網站算法架構

2020-04-10 08:55:26

TCPIPBBR算法

2021-11-22 23:20:01

加密算法架構
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国产精品视频 | 欧美6一10sex性hd | 欧美二区乱c黑人 | 超碰伊人久久 | 在线观看亚洲精品视频 | 国产精品1区| 久久精品中文 | 久久不卡| 欧美视频区 | 日本在线精品视频 | 亚洲人在线观看视频 | 99在线免费视频 | 国产成人精品午夜视频免费 | 国产精品久久 | 欧美精品一区二区三区一线天视频 | 91精品国产91久久综合桃花 | 国产亚洲欧美在线 | 人人爽人人爽 | 欧美天堂 | 91精品国产综合久久国产大片 | 夜夜av| 国产电影一区二区 | 懂色av蜜桃av | 香蕉91| 亚洲天堂男人的天堂 | 久久不卡 | 日韩一区三区 | 国产精品久久影院 | 成人国内精品久久久久一区 | 中文字幕av在线一二三区 | 亚洲小视频 | 久久免费视频在线 | 免费小视频在线观看 | 亚洲欧美日韩一区 | 337p日本欧洲亚洲大胆鲁鲁 | 国产中文字幕网 | 日韩有码一区二区三区 | 午夜国产 | 欧美一区二区三区日韩 | 国产精品123区 | 日韩不卡视频在线 |