成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

老王帶你搞定社交網絡分析

大數據
其實,人與人之間的關系往往錯綜復雜,何不讓數據模型幫你挖掘一下,找出打入阿花朋友圈的最短路徑?

 [[173563]]

 

 

程序員老王對隔壁公司的美女經理阿花十分仰慕,雖然他們常常在寫字樓電梯間偶遇,最多也就是點頭問好,但怎樣才能名正言順和阿花在工作以外的時空產生交集?其實,人與人之間的關系往往錯綜復雜,何不讓數據模型幫你挖掘一下,找出打入阿花朋友圈的最短路徑?本期就讓老王帶你了解社交網絡分析(SNA)。

社交網絡分析究竟是干嘛的

社交網絡分析(Social Network Analysis) 最早是由英國著名人類學家拉德克利夫-布朗(Radcliffe-Brown)在對社會結構的分析關注中提出,是理解人類(可延展為任意主體)各種關系的構成、交互模式以及信息傳播規律的分析方法,使用技術包括離散數學、隨機過程、社會學、管理學、心理學等多學科的融合理論和方法。

上面這段太玄乎了,我們實在點,搞懂了SNA,你可以解決這幾種問題:

可達性問題

如果你有全城人的電話通訊錄,SNA可以告訴你某人和阿花是否認識,即使TA的電話本里沒有阿花的電話;

老王到阿花可能有多種聯系方式,找到途徑節點最少的那條。

傳播問題

老王的朋友圈里,有三個是Fintech精英,年薪百萬,還有兩個賭徒,他還有一個叔叔是被法院通告的老賴;能否估計老王經濟狀況,信用風險?

廣告投放給誰傳播效率***?你關注的大V是真的傳播力驚人還是八十萬水軍教頭?公司里誰是八卦源頭?

演進問題

你在Linkedin 上更新了職位,是不是收到了很多新的人脈介紹?Linkedin 是怎樣優化推薦算法幫你打入新圈子?

公司從10人打拼到500人,人事結構經歷怎樣變化?如何優化組織的人力結構?怎樣從郵件交互中識別誰是拍板的,誰是跑腿的,誰是活稀泥的?

社交網絡基本要素

為完成以上目標,我們要用圖語言來描述問題和建模,不用擔心,大部分是非常符合直覺的概念。

  • 節點(Node):節點是指要分析的物體,每一個物體就是一個節點,比如在Social Network中每個人就是一個節點。
  • 邊(Edge):Graph中兩個節點間的連線,用于表示兩個節點的關系。比如在Social Network中兩個人的關注關系,微博傳播中轉發關系。
  • 圖(Graph):圖是用來表示一組物體之間的關系的方式。有向圖(Directed Graph):邊代表的關系具有方向的圖。比如微博的關注關系,電話撥入呼出,銀行轉賬收賬就是有方向的。無向圖(Undirected Graph):邊代表的關系沒有方向的圖。
  • 度(Degree):節點的度是指與其相連的邊數,你通訊錄的名單長度就是你的聯絡人度數。
  • 輸入度(In-degree):有向圖中一個節點收到的邊。
  • 輸出度(Out-degree):有向圖中一個節點發出的邊。
  • 路徑(Route): 兩個節點之間經過的邊和節點序列,路徑有長度,通常衡量兩個點之間的距離。

社交網絡分析的應用

小世界(六度分隔):找對人

在日常生活中,有時你會發現,某些你覺得與你隔得很“遙遠”的人,其實與你“很近”。小世界網絡就是對這種現象(也稱為小世界現象)的數學描述。用數學中圖論的語言來說,小世界網絡就是一個由大量頂點構成的圖,其中任意兩點之間的平均路徑長度比頂點數量小得多。除了社會人際網絡以外,小世界網絡的例子在生物學、物理學、計算機科學等領域也有出現。二十世紀60年代,美國哈佛大學社會心理學家斯坦利·米爾格倫(Stanley Milgram)做了一個連鎖信實驗。他將一些信件交給自愿的參加者,要求他們通過自己的熟人將信傳到信封上指明的收信人手里,他發現,20%的信件最終送到了目標人物手中。而在成功傳遞的信件中,平均只需要6.5次轉發,就能夠到達目標。也就是說,在社會網絡中,任意兩個人之間的“距離”是6。這就是所謂的“六度分隔”理論。

三元閉包:弱聯系會變成強聯系

這個是對網絡穩定性的探討,是關于網絡演進非常基礎也很重要的一個認識。如果存在 a <-> b, b <-> c, 那 a <-> c 的期望會非常高 。在時間序列上對很多網絡的動態演進過程分析都驗證了這個觀點。對它的解讀也非常符合我們的日常認識:近墨黑,近朱赤; 愛屋及烏 等。

三元閉包在很多線上線下場景都有很多的應用。比如你在 Linkedin 上更新一下聯系人,會得到后臺很多聯系人推送,你會發現Linkedin 的推送節制而高效,既沒過分打擾,又能打開你的人脈,這種推送是基于三元閉包理論的。

[[173564]]

三種重要結構:環、簇、樹

三元閉包構成了一個最小的穩定結構:包含3個節點的環(Loop)。 對一般社交網絡來說,環形結構不算特別。在有些場景,環形意味著風險和欺詐。

比如收集一個年度所有車輛受損和理賠案件信息,構成一個理賠網絡。因為車輛事故是低概率事件, 這個網絡必定是節點數量遠遠超過邊的數量的稀疏圖。如果在這樣的網絡里你能找到這樣的撞車-理賠鏈條:

這個鏈條就非常可疑,往往和團伙騙保相關。

除了環形(Loop),還有一種結構特別重要:聚集(Clique)。根據小世界理論,微弱的關聯可以讓全世界構成一個大的網絡,如果以路徑可達作為‘認識’ 的判斷標準,看起來感覺誰都認識,但是誰都不熟。 Clique 就是一個強連接的小網絡:如果一群人兩兩直接認識,這一群人構成一個Clique。舉個例子,產品部的同學們彼此認識,整個部門是一個Clique;產品部的小洪因為參加足球隊認識了開發部一眾兄弟,通過小洪同學,整個產品部都可以和開發部傳遞需求,但是產品部+開發部不是一個Clique,因為兩邊只要有一對人不能直接溝通就不算是Clique了。 說到這里Clique 的重要性就很明了。

樹形結構代表是人力資源圖,對大部分公司來說這都是僅限HR訪問的資源,有檢驗的人在公司結構圖中可以窺見很多信息:公司發展處于那個階段, 結構是否健康,資源傾斜在那個業務線,人力交叉情況,信息流通成本。

 

 

 

多數樹形結構都不是嚴格樹,存在環形和共享葉節點。嚴格樹形暗示這是個不同尋常的人事組織,比如邪教和傳銷組織,教主為了保持神秘性,傳銷頭目為了掌控自己的下線資源,往往有意控制人事網絡的結構,行成金字塔形, 并讓底部網絡盡可能隔離,避免下線自由交換信息,保持自己的控制力。這種網絡結構非常不自然,在正常的社交壓力下非常容易崩潰變形,只有通過洗腦,精神/金錢控制才能存在。

 

 

 

社交網絡分析難點在哪里

簡單說,非線性的模型都很難,而SNA玩的就是網絡,肯定難上加難。以上問題除了能一階判斷的可達性,沒有一個是簡單的。原因如下:

圖分析最壞情況通常很壞

考慮最簡單的可達判斷,如果原始關系是點對存儲 (a -> b), 想得到 (x -> y) 的結果需要遍歷完成。因為圖的結構特點,遍歷圖比遍歷列表,遍歷字典更難以預期。一個經典的例子是小世界網絡(也叫六度分割),大意是地球上任意兩個人的社交距離不會大于6。反過來想就是:從一個人出發,只要六次深度遍歷迭代就要訪問所有人的信息!為了判斷阿明是否認識阿花,如果我們不走運,可能要遍歷全城的人信息才能得出一個肯定的答案,而這差不多是SNA中最簡單的問題了(圖中右下方紅色路徑)!

[[173568]]

結構不穩定

這也是和非線性結構相關的。拿身邊的例子說,滴滴 和 uber突然合并前,管理層一對姐妹花是認識的,少量員工可能在挖角中互換陣營也是認識的,但兩家公司構成的人員網絡大體上是分開的。隨著突然并購,兩家公司網絡迅速融合,任意兩個節點的可達性,關系路徑長度都發生了極大的變化。如果用臨時表存儲上述信息,這張大表在一天之內的有效性就降低為零了。牽一發動全身形容網絡對微小變化的敏感實在太貼切了。

總結

由于在線社交網絡具有的規模龐大、動態性、匿名性、內容與數據豐富等特性,近年來以社交網站、博客、微博等為研究對象的新興在線社交網絡分析研究得到了蓬勃發展,在社會結構研究中具有舉足輕重的地位。

今天說了這么多和社交網絡分析有關的原理和概念,想必老王這樣的老司機早就在碼代碼了。別著急!下期讓老王接著講講,如何規避上述社交網絡分析的難點,并著重講講其在現實場景中的應用。

責任編輯:趙寧寧 來源: 36大數據
相關推薦

2021-01-21 10:50:03

僵尸網絡FreakOutLinux 系統

2009-08-13 21:51:18

2025-02-17 04:00:00

SpringDgraph系統

2015-07-06 10:06:57

網絡分析高級運營分析

2009-11-17 18:55:44

2009-11-17 17:26:03

2009-12-31 10:36:48

網絡分析高彥剛

2013-08-26 10:10:23

2013-04-09 09:51:25

科來網絡分析

2017-05-03 08:59:07

網絡分析數據

2009-11-18 16:44:58

2015-12-11 10:09:38

2011-04-11 13:58:09

TCP

2010-04-02 22:19:40

網絡分析產品安全防御科來軟件

2009-11-18 16:37:20

2010-08-26 11:31:24

網絡分析模塊NAM

2021-02-23 10:05:39

Linux網絡分析tcpdump

2021-02-26 05:38:39

Linux網絡Tcpdump

2014-04-22 09:47:36

2009-11-17 17:45:59

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线观看黄色电影 | 国产精品99久久久久久久vr | 中国大陆高清aⅴ毛片 | 国产精品久久久一区二区三区 | 国产综合精品一区二区三区 | 午夜电影网 | 亚洲 中文 欧美 日韩 在线观看 | 91精品国产一区 | 久久久久久久久一区 | 久久成人免费 | 欧美专区在线 | 在线观看av网站永久 | 91精品国产综合久久久久久漫画 | 国产真实精品久久二三区 | 成人av片在线观看 | 午夜免费网站 | 日韩福利在线观看 | 午夜影院免费体验区 | 国产91精品久久久久久久网曝门 | 久久综合一区二区 | 在线看91 | 国产精品久久久久久久久久久久久久 | 欧美激情在线观看一区二区三区 | 久久久久国产精品一区二区 | 91av视频 | 国产免费一区二区三区最新6 | 亚洲视频一区在线播放 | 亚洲在线高清 | 成人精品久久日伦片大全免费 | 欧洲在线视频 | 亚洲精品99 | 久久草在线视频 | 精品亚洲第一 | 色婷婷影院 | 欧美网址在线观看 | www.天天操 | 精品中文字幕在线观看 | 不卡一二三区 | 天天躁日日躁狠狠的躁天龙影院 | 久久成人av电影 | 中文字幕伊人 |