成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數(shù)據(jù)分析常見效應(yīng)&定律

大數(shù)據(jù) 數(shù)據(jù)分析
今天師兄整理了一下咱們數(shù)分領(lǐng)域常見的效應(yīng)和規(guī)律,希望可以幫大家。

[[392009]]

在討論數(shù)據(jù)和業(yè)務(wù)的過程中,如果對方時不時蹦出個這效應(yīng),那定律,自己沒有了解的話會感覺一臉懵,其實(shí)這些概念也沒有什么神秘的,今天師兄整理了一下咱們數(shù)分領(lǐng)域常見的效應(yīng)和規(guī)律,希望可以幫大家。

馬太效應(yīng)

馬太效應(yīng)出自圣經(jīng)《新約·馬太福音》里有一則寓言:“凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來”。中國也有類似的古語,看過83版射雕英雄傳的同學(xué)應(yīng)該對九陰真經(jīng)里面 “天之道,損有余而補(bǔ)不足” 這句話印象深了,這句話出自老子的《道德經(jīng)》,完整的古語為“天之道,損有余而補(bǔ)不足;人之道則不然,損不足以奉有余”,意思是:自然的法則,是損減有余來補(bǔ)充不足。人類社會世俗的作法卻不然,而是損減貧窮不足來供奉富貴有余。這兩句古語比較直觀地表述了馬太效應(yīng),通俗地解釋為 “強(qiáng)的越強(qiáng),弱的越弱”。

馬太效應(yīng)在業(yè)務(wù)中非常常見。比如在推薦算法中,被判定為質(zhì)量較好的用戶所得到的資源就越多,這種情況也會形成反饋,得到的資源越多越會被判定為質(zhì)量較好的用戶,從而加劇這種效應(yīng)(類似于短視頻點(diǎn)贊越多曝光越多,曝光越多點(diǎn)贊越多)。

虹吸效應(yīng)

有些同學(xué)小時候可能做過這樣的事情,把一根軟管子一頭插入水槽里面,用嘴把水吸出來,然后把軟管子的另一頭放地比水槽里水面低,那么水就能源源不斷地流出來,其中的道理就是虹吸效應(yīng):液態(tài)分子間存在引力與位能差能,使液體會由壓力大的一邊流向壓力小的一邊。在業(yè)務(wù)中的虹吸效應(yīng)指的是,某一主體將資源吸引過去,從而使得自身相比其他主體更加有吸引力,并導(dǎo)致其他主體營養(yǎng)不良的現(xiàn)象。

這與馬太效應(yīng)有相似之處但是并不相同,如果說馬太效應(yīng)通俗理解為“強(qiáng)者越強(qiáng),弱者越弱”,那么虹吸效應(yīng)的通俗解釋為“大樹地下不長草”。強(qiáng)者越強(qiáng)不一定是以犧牲弱者為代價,而虹吸就像一塊干海綿,把周邊的資源吸干,導(dǎo)致周邊沒有資源可用甚至寸草不生。

比如,在勞動力市場,每年985,211畢業(yè)的本科研究生數(shù)量是有限的,大公司用誘人的薪資待遇吸引人才,導(dǎo)致這部分人才大部分流向大公司,小公司則相對較難招聘到這部分畢業(yè)生,這也是一種虹吸現(xiàn)象。再比如,在渠道投放時,假如渠道投放的總體預(yù)算是固定的,假如增加某一廠商渠道A的費(fèi)用使此渠道的ECPM值(可以理解為廠商對品牌方的一種評價指標(biāo),ECPM值越高在投放中將獲得更好的資源)上漲,進(jìn)而導(dǎo)致渠道A的成本下降,渠道投放人員就有可能把其他渠道的預(yù)算轉(zhuǎn)移到A,久而久之A渠道的預(yù)算占比會越來越高,其他渠道預(yù)算占比越來越低,長尾的小渠道可能會停止投放。

幸存者偏差

幸存者偏差講的目光聚焦于“幸存下來”的群體具備的某些特征,但是忽略了“未幸存下來”的群體是否也是具備相同的特征。這里“幸存”的概念,其實(shí)更合理的說法應(yīng)該是“篩選”。

在二戰(zhàn)中統(tǒng)計學(xué)家沃德教授曾收到美國軍方邀請,為降低飛機(jī)被擊落的概率提出建議。經(jīng)過觀察發(fā)現(xiàn)機(jī)翼是被擊中最多的地方,而機(jī)尾被擊中概率比較小。當(dāng)時軍方的指揮官認(rèn)為應(yīng)該加強(qiáng)機(jī)翼的防御,但是沃德教授的結(jié)論是要加強(qiáng)機(jī)尾的防御。原因在于樣本僅統(tǒng)計了返航的飛機(jī),機(jī)翼被集中多次依然能夠返航說明機(jī)翼并非是致命的地方。機(jī)尾被打中的飛機(jī),會導(dǎo)致引擎受損而無法返航。

辛普森悖論

辛普森悖論指的是,當(dāng)對比AB兩個群體的數(shù)據(jù),并將數(shù)據(jù)拆分成多個維度時,A組在各個維度下的表現(xiàn)均好于B,整體A組的表現(xiàn)卻并不一定好于B。

舉一個栗子,對比AB兩個競品的留存,將留存拆分成新用戶和老用戶兩部分,競品A新老用戶的留存均高于競品B,但是競品A的整體留存卻低于競品B。出現(xiàn)這種情況的原因在于兩點(diǎn),第一是兩個競品新老用戶的占比不一致;第二是競品A老用戶的留存高于競品B新用戶的留存(也可以是競品A新用戶的留存高于競品B老用戶的留存,在此以其中一種情況進(jìn)行說明)。如果競品A老用戶占比高于競品B,那么競品B在老用戶留存累計的優(yōu)勢就有可能抹平競品B新用戶留存積累的劣勢,使得整體留存高于A。

通俗地講,就好比兩個拳擊手X,Y對打,Y在各個方面都比X有優(yōu)勢,如果X采取以牙還牙的策略定是贏不了Y,所以X需要集中優(yōu)勢力量攻打Y的軟肋,雖然X自己也會收到攻擊,但是如果X對Y造成的傷害遠(yuǎn)遠(yuǎn)高于自己可以承受的傷害,就有可能先把Y撂倒。那“農(nóng)村包圍城市,武裝奪取政權(quán)” 是否也是有類似的思想呢?

想要詳細(xì)了解的話可以看師兄之前寫的文章:秒懂辛普森悖論---一篇文章就夠了

本福特定律

本福特定律,是說一堆從實(shí)際生活得出的數(shù)據(jù)中,以1為首位數(shù)字的數(shù)的出現(xiàn)機(jī)率約為總數(shù)的三成(30.1%),這個定律至今沒有經(jīng)過一個嚴(yán)格的證明,他就像是大自然賦予我們的一個監(jiān)控指標(biāo),當(dāng)一組數(shù)據(jù)不符合本福特定律時,就有理由懷疑數(shù)據(jù)是否造假。所以此定律經(jīng)常用在檢測上市公司財報是否造假以及選舉中是否有舞弊現(xiàn)象。

想要詳細(xì)了解的話可以看師兄之前寫的文章:秒懂本福特定律

帕累托定律

這個名字大家可能并不熟悉,但是一定聽過二八定律,管理學(xué)家帕累托通過研究大量事實(shí)發(fā)現(xiàn):社會上20%的人占有80%的社會財富。后來經(jīng)過豐富與發(fā)展這個定律表述為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數(shù),卻是次要的。比如活躍用戶中僅有20%的付費(fèi)用戶,付費(fèi)用戶中20%的用戶貢獻(xiàn)了80%的收入等等。當(dāng)然20%與80%只是一個統(tǒng)計數(shù)據(jù),其實(shí)質(zhì)講的是 “在因和果、努力和收獲之間,普遍存在著不平衡關(guān)系” , 即不平衡關(guān)系存在的確定性和可預(yù)測性。

二八定律告訴我們把精放在更本質(zhì)的事情上,不經(jīng)規(guī)劃地做事情很有可能會浪費(fèi)80%的精力去產(chǎn)出20%的東西。有些同學(xué)在做分析的時候,可能有這種感受,跑了n個sheet的數(shù)據(jù),結(jié)果寫報告的時候,只用了四五個數(shù)據(jù)。所以在分析的習(xí)慣是先思考產(chǎn)生問題的原因,并對每個可能的原因賦予權(quán)重,然后以最簡單快捷地方式來驗證各個原因,快速排除錯誤方向,而不是在每個原因上都做詳細(xì)的解釋。

這一期的概念就整理到這里,你還知道有什么與數(shù)據(jù)分析相關(guān)的效應(yīng)么?

 

 

責(zé)任編輯:姜華 來源: 數(shù)師兄
相關(guān)推薦

2019-07-31 14:16:35

大數(shù)據(jù)人工智能算法

2022-06-15 15:34:12

數(shù)據(jù)分析分析模型誤區(qū)

2017-07-24 09:18:55

大數(shù)據(jù)數(shù)據(jù)分析行為事件分析

2017-04-13 12:59:43

數(shù)據(jù)分析

2022-10-12 00:13:20

數(shù)據(jù)分析人工智能數(shù)據(jù)可視化

2019-05-06 09:27:13

數(shù)據(jù)分析大數(shù)據(jù)開發(fā)數(shù)據(jù)

2015-08-14 10:28:09

大數(shù)據(jù)

2022-06-30 15:12:48

數(shù)據(jù)分析工具大數(shù)據(jù)

2021-08-12 11:37:23

數(shù)據(jù)分析錯誤

2020-05-28 08:58:29

數(shù)據(jù)分析分析系統(tǒng)數(shù)據(jù)

2021-04-09 13:14:52

數(shù)據(jù)分析技術(shù)大數(shù)據(jù)

2020-05-11 18:00:48

規(guī)范數(shù)據(jù)分析架構(gòu)

2020-05-28 11:34:08

互聯(lián)網(wǎng)數(shù)據(jù)分析數(shù)據(jù)

2017-04-11 09:08:02

數(shù)據(jù)分析Python

2022-11-14 10:36:55

數(shù)據(jù)科學(xué)數(shù)據(jù)分析

2015-08-11 15:52:52

大數(shù)據(jù)數(shù)據(jù)分析

2020-11-06 08:30:45

數(shù)據(jù)分析數(shù)據(jù)思維錯誤

2016-03-16 10:39:30

數(shù)據(jù)分析數(shù)據(jù)科學(xué)可視化

2024-07-01 08:51:19

可視化數(shù)據(jù)分析漏斗

2015-10-26 10:41:10

數(shù)據(jù)分析思想指南
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 欧美一级电影免费观看 | 日韩在线免费视频 | 欧美极品视频 | 国产一区在线免费观看 | 欧美一区二区三区在线 | 色眯眯视频在线观看 | 免费在线日韩 | 国产精品亚洲第一 | 欧美精品一区二区三区在线播放 | 久久av网 | 日韩成人精品一区二区三区 | 欧美日韩国产在线观看 | 免费国产成人av | 亚洲国产精品第一区二区 | 久久综合久久综合久久 | 免费看国产a | 色综合久久久 | 99色综合| 韩日一区二区三区 | 午夜精品久久久 | 求个av网址| 日本不卡一区二区三区在线观看 | 精品欧美一区二区久久久伦 | 欧美999 | 日韩视频在线观看 | 成人欧美一区二区三区黑人孕妇 | 在线一区视频 | 成人精品一区二区三区 | 欧美a区| 精品精品 | 亚洲国产aⅴ精品 | 日韩一区二区三区在线观看 | 午夜电影在线播放 | 欧美成人免费 | 青青久久| 91伊人| 欧美日韩亚洲国产综合 | 国产精品黄色 | 亚洲午夜三级 | 亚洲欧美综合精品另类天天更新 | 干干天天 |