成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為什么互聯(lián)網(wǎng)巨頭如此熱衷于A/B測試?

新聞
A/B 測試——又被稱為小流量實驗。通常是針對某個功能/UI/邏輯策略等,提供兩種(或多種)不同的備選解決方案,從總體用戶中隨機(jī)抽取一小部分流量,分配給不同方案,最終通過實驗數(shù)據(jù)對比來確定最優(yōu)方案。

A/B 測試前身:歷史悠久的對照實驗

今天互聯(lián)網(wǎng)巨頭熱衷的 A/B 測試,其實源于學(xué)術(shù)層面的“隨機(jī)對照試驗”,作為一種方法論,這種對照試驗有著悠久的歷史:

  • 1747 年,為了治療壞血病,皇家海軍的外科醫(yī)生 James Lind 設(shè)計了一項實驗。他測試了蘋果醋、大麥水、橘子等六種不同藥方。

最終發(fā)現(xiàn)新鮮的橘子為最佳的治療藥物,盡管那時并不清楚是橘子中維 C 的作用。

[[407113]]

1835 年,醫(yī)學(xué)史上第一次“雙盲實驗”在紐倫堡實現(xiàn)。一位名為弗里德里希的公共衛(wèi)生官員,為對抗當(dāng)時頗為流行的順勢療法開啟了一個賭注:將 25 瓶順勢療法鹽水和 25 瓶蒸餾水分發(fā)給 50 位雙盲受試者。

最后 8 位聲稱產(chǎn)生了治療效果,但揭盲后發(fā)現(xiàn),有 3 位喝的其實是蒸餾水,弗里德里希贏得了賭注。

1935 年,統(tǒng)計學(xué)家兼生物學(xué)家羅納德·費雪(Ronald Fisher)寫了一本名為《實驗設(shè)計》的書。在書中,他系統(tǒng)論述了隨機(jī)對照實驗的設(shè)計原則和統(tǒng)計檢驗的方法,成為實驗設(shè)計領(lǐng)域的開山之作。

1944 年,在制造原子彈的過程中,曼哈頓計劃的領(lǐng)軍科學(xué)家奧本海默,用 3 種方法測試如何分離鈾 235,這一步驟成為整個項目中最關(guān)鍵的環(huán)節(jié)之一。

1960 年代,大衛(wèi)·奧格威用對照測試的方法驗證廣告的有效性——寫兩條不同的文案并要求報紙將其各印一半,同時在文案中留下索取免費樣品的郵編和地址,但樣式不一樣,最終根據(jù)實際樣品索取量來觀察哪種文案效果更好。

……

可以清楚地看到,隨機(jī)對照實驗作為一種方法論,在現(xiàn)代科學(xué)和商業(yè)發(fā)展中發(fā)揮了重要作用。它本質(zhì)上能通過控制單一變量的方法來尋找最優(yōu)解決方案,已經(jīng)被廣泛運用到工程學(xué)、醫(yī)學(xué)、教育學(xué)和多個領(lǐng)域的商業(yè)實踐中。而我們今天要聊的 A/B 測試其實就是隨機(jī)對照實驗在互聯(lián)網(wǎng)領(lǐng)域的具體應(yīng)用。

A/B 測試,互聯(lián)網(wǎng)巨頭的標(biāo)配

A/B 測試——又被稱為小流量實驗。

通常是針對某個功能/UI/邏輯策略等,提供兩種(或多種)不同的備選解決方案,從總體用戶中隨機(jī)抽取一小部分流量,分配給不同方案,最終通過實驗數(shù)據(jù)對比來確定最優(yōu)方案。

今天,在硅谷和中國的互聯(lián)網(wǎng)頭部企業(yè),A/B 測試已經(jīng)成為業(yè)務(wù)發(fā)展的標(biāo)配。我們簡單梳理下 A/B 測試是如何風(fēng)靡各大互聯(lián)網(wǎng)巨頭的——2000 年 2 月 27 日,谷歌搜索部門的一位工程師進(jìn)行了互聯(lián)網(wǎng)時代的第一次 A/B 測試——他想知道搜索結(jié)果每頁展示多少條是效果最好的,當(dāng)時默認(rèn)為 10。實驗是這樣設(shè)計的:對于 0.1%的搜索流量,每頁顯示 20 條結(jié)果;另外兩個 0.1%分別顯示 25 條、30 條。這次測試從直接結(jié)果看并不成功——由于技術(shù)故障,實驗組頁面的加載速度明顯慢于對照組,最終導(dǎo)致實驗的相關(guān)指標(biāo)下降。

但谷歌因此獲得了意外收獲——他們發(fā)現(xiàn)即便是0.1秒的加載延遲也會顯著影響用戶滿意度。很快,谷歌將改善響應(yīng)時間提升為高優(yōu)先級事項。以這次實驗為開端,A/B 測試在谷歌內(nèi)部快速流行起來。

2012 年,據(jù)谷歌的首席經(jīng)濟(jì)學(xué)家范里安稱,谷歌每年就會開展超過 5000 次的 A/B 測試。

亞馬遜早期,工程師 Greg Linden 曾提出一個想法——在客戶支付時,根據(jù)他們購物車中的商品,向他們提供個性化的“沖動購買”建議。他精心做了一個 Demo,但演示后當(dāng)時亞馬遜的一位副總裁武斷地否決了這一想法。Greg Linden 并不氣餒,他業(yè)余時間用三個半月完成了這一功能的開發(fā),并對這個功能進(jìn)行了小流量的測試。結(jié)果證明,即便是這個極其粗糙、簡陋的版本,也讓實驗組用戶的購買規(guī)模提升了 17%。

于是,“商品推薦”這個今天司空見慣的功能從此在亞馬遜開啟。

在 Facebook,CEO 扎克伯格曾公開宣稱:

“在任何給定的時間點,都不會只有一個版本的 Facebook 在線上運行,而是有超過一萬個,我們的實驗框架能隨時發(fā)現(xiàn)和感知用戶最細(xì)微的行為差異。”

在中國,頭部的互聯(lián)網(wǎng)企業(yè)也都有自己的 A/B 測試平臺。比如字節(jié)跳動的 Libra、美團(tuán)的 Gemini、滴滴的阿波羅。張一鳴曾表示——“即使你有99%的把握某個名字比另一個名字更好,測一測又有什么關(guān)系呢?”

目前在字節(jié)跳動,每天同時進(jìn)行的 A/B 測試達(dá)上萬場,單日新增實驗數(shù)量超過 1500 個,覆蓋 400 多項業(yè)務(wù)。截至今年 3 月底,字節(jié)跳動累計已經(jīng)做了 70 多萬次 A/B 測試。

為什么互聯(lián)網(wǎng)巨頭熱衷于 A/B 測試?

互聯(lián)網(wǎng)公司大規(guī)模運用 A/B 測試并非偶然,這背后深層次的原因在于,A/B 測試是數(shù)據(jù)驅(qū)動理念的最佳落地實踐。它能以最小的風(fēng)險實現(xiàn)業(yè)務(wù)的有效反饋。

字節(jié)跳動在發(fā)布 APP 的時候,通常會給 APP 取多個名字,打多個包上架到應(yīng)用市場進(jìn)行 A/B 測試,觀察不同名字的下載率、留存率等指標(biāo)。這背后其實是一種尊重客觀事實的決策哲學(xué)。事實上,在硅谷的互聯(lián)網(wǎng)文化中,那些靠拍腦袋的決策有一個專有名詞“HiPPO”—”Highest-paid person’s opinion”,即“公司收入最高的那個人說了算”。

谷歌的技術(shù)專家 Avinash Kaushik 曾說:

  • “大多數(shù)互聯(lián)網(wǎng)產(chǎn)品都很糟糕,因為 HiPPO 創(chuàng)造了它們。”

Netflix 在 2016 年 4 月的一篇技術(shù)博客中寫道:

  • “通過對照測試的方法,我們確保產(chǎn)品變更不是由最固執(zhí)己見,和最有發(fā)言權(quán)的 Netflix 高管驅(qū)動,而是由實際的在線數(shù)據(jù)驅(qū)動,這是我們走向成功的基礎(chǔ)。”

有人會問——A/B測試的決策思想其實由來已久,為什么直到現(xiàn)在才變得流行起來?

答案是——實驗成本。

在硬件產(chǎn)品時代,產(chǎn)品的開發(fā)成本很高,一臺電腦如果控制不同變量,事實上它就變成兩臺不同的電腦,本質(zhì)上屬于兩條產(chǎn)品線,而開發(fā)多條產(chǎn)品線對于硬件產(chǎn)品的成本是非常高的。軟件產(chǎn)品時代開發(fā)成本同樣高昂,一個版本的 Windows 要開發(fā)數(shù)年,一個 3A 大作開發(fā)同樣動輒數(shù)年,這樣龐大的開發(fā)成本是無法同時進(jìn)行不同版本的開發(fā)的。同時,無論是硬件產(chǎn)品還是軟件產(chǎn)品,它們從開發(fā)、上市到客戶反饋,這個周期是極其漫長的,這樣冗長的周期也讓靈活多變的 A/B 測試難以大規(guī)模應(yīng)用。而到了互聯(lián)網(wǎng)時代,每一個產(chǎn)品特性都可以快速迭代,每一次迭代都能迅速得到反饋。開發(fā)成本的降低和反饋周期的縮短——這兩重因素?zé)o疑給A/B測試提供了極其便利的實踐條件。

為了讓 A/B 測試的價值得到更大發(fā)揮,很多互聯(lián)網(wǎng)巨頭還將這項能力開放給 C 端用戶。比如今日頭條發(fā)布文章的界面,作者可以取雙標(biāo)題和雙封面,經(jīng)過小流量的測試之后,推薦系統(tǒng)會自動推薦點擊率高的標(biāo)題。Facebook 的廣告系統(tǒng)也給廣告主提供了一項組合實驗?zāi)芰Γ纯蛻艨梢陨蟼鞑煌臉?biāo)題、描述、封面和按鈕。Facebook 自動對這些元素進(jìn)行隨機(jī)組合,形成多個創(chuàng)意進(jìn)行 A/B 測試,自動將預(yù)算分配到轉(zhuǎn)化率最高的創(chuàng)意組合上。

為什么今天傳統(tǒng)的“廣告大師”越來越少了?因為互聯(lián)網(wǎng)廣告在很大程度上不再依靠“大師”的靈光乍現(xiàn),而是更多地依靠優(yōu)化師每天測試無數(shù)版文案和素材,甚至很多文案是機(jī)器生成的。

如何利用工具做好 A/B 測試?

我們在上面的部分了解了 A/B 測試的原理和意義,很多公司會問:我知道在增長日益困難的今天,A/B 測試是一個好東西,那到底應(yīng)該如何付諸實踐呢?

的確,A/B 測試的實踐并不是一個簡單的過程,它比很多人想象得要困難,這個困難體現(xiàn)在幾個層面——

首先,需要確定 A/B 測試的關(guān)鍵環(huán)節(jié)。A/B 測試到底測什么的問題,即企業(yè)必須清楚哪些環(huán)節(jié)是推動業(yè)務(wù)發(fā)展的關(guān)鍵,在關(guān)鍵環(huán)節(jié)上進(jìn)行試驗。如果找不到關(guān)鍵環(huán)節(jié),在無關(guān)痛癢的環(huán)節(jié)上,無論做多少 A/B 測試也是徒勞的。

其次,需要確保 A/B 測試過程的科學(xué)性和合理性。比如控制單一變量,即確保實驗組和對照組只有一個關(guān)鍵變量是存在差異的;比如確保流量分配的均勻隨機(jī),即實驗組和對照組的流量是完全獨立的,不存在互相影響的關(guān)系。

最后,還需要確定合適的評價指標(biāo)。評價指標(biāo)通常不止一個,是看 A 指標(biāo)還是 B 指標(biāo)?過程指標(biāo)還是結(jié)果指標(biāo)?短期指標(biāo)還是長期指標(biāo)?單個指標(biāo)還是多重指標(biāo)?這些都需要根據(jù)業(yè)務(wù)實際情況審慎決定。

總結(jié)

A/B 測試作為一種科學(xué)的實驗手段,能夠幫助企業(yè)在多種方案中尋求最優(yōu)解,以最小的風(fēng)險前置性地驗證策略效果,為企業(yè)規(guī)避風(fēng)險。作為互聯(lián)網(wǎng)時代的企業(yè),理性擁抱前沿趨勢永遠(yuǎn)是最優(yōu)的選擇。

責(zé)任編輯:未麗燕 來源: 優(yōu)設(shè)
相關(guān)推薦

2015-06-29 14:02:28

IT企業(yè)云計算云數(shù)據(jù)中心

2019-02-20 11:14:08

程序員技能溝通

2019-07-01 15:39:33

互聯(lián)網(wǎng)

2021-12-06 10:23:45

互聯(lián)網(wǎng)支付牌照支付市場

2015-10-26 10:45:00

2021-09-29 16:24:29

加密貨幣比特幣貨幣

2020-09-15 08:29:02

SVNGit存儲

2013-08-05 10:54:05

移動互聯(lián)網(wǎng)入口移動互聯(lián)網(wǎng)移動市場

2015-02-12 09:18:42

無線網(wǎng)絡(luò)WLAN云Wi-Fi

2019-11-26 14:47:32

互聯(lián)網(wǎng)云計算云服務(wù)

2021-02-08 23:10:08

春晚紅包互聯(lián)網(wǎng)

2019-02-27 10:52:14

互聯(lián)網(wǎng)擴(kuò)招裁員

2015-11-16 14:08:39

醫(yī)療行業(yè)互聯(lián)網(wǎng)

2015-05-04 13:57:20

SDN騰訊華三通信

2013-12-08 21:19:03

2020-07-29 12:02:00

互聯(lián)網(wǎng)智慧農(nóng)業(yè)巨頭

2019-09-09 09:29:27

互聯(lián)網(wǎng)程序員職業(yè)

2021-09-23 22:34:03

區(qū)塊鏈互聯(lián)網(wǎng)技術(shù)

2024-07-03 11:05:02

2021-10-25 15:02:34

物聯(lián)網(wǎng)人工智能IoT
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 一区二区在线不卡 | 国产精品美女久久久久久免费 | 国产美女福利在线观看 | 欧美另类视频在线 | 韩国毛片视频 | 欧美精品综合在线 | 中文字幕一区在线观看视频 | 国产精品视频久久久 | 一区二区三区在线电影 | 天天天久久久 | 天天爱爱网 | 亚洲色视频 | 综合二区 | 自拍偷拍一区二区三区 | 国产一级在线 | 精品福利一区二区三区 | 91福利网| 日韩欧美在线观看 | 99国产精品视频免费观看一公开 | 亚洲欧美激情精品一区二区 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 国产一区二区不卡 | 成人网视频 | 国产欧美在线观看 | 91 在线 | 国产精品久久久亚洲 | 国产精品久久久久久久7电影 | 亚洲综合国产精品 | 99热在这里只有精品 | 国产成人精品一区二 | 亚洲免费成人av | 欧美精品在线看 | 午夜精品久久久久久久久久久久久 | 欧美一区二区成人 | 久久精品| 欧美午夜视频 | 日本一级淫片免费啪啪3 | 国产精品一区三区 | 精品国产乱码一区二区三 | 中文字幕乱码一区二区三区 | 亚洲精品欧美一区二区三区 |