十季劇集數據分析,《老友記》中的C位原來是TA!
大數據文摘出品
編譯:Ivy、睡不著的iris、魏子敏
距《老友記(Friends)》***一集播出至今已有13年之久,但人們對它熱情幾乎未減分毫。至少文摘菌每次吃飯的時候都會隨機選擇一集《老友記》佐飯。
來自印度的數據科學家Yashu Seth也是資深《老友記》粉絲,一次觀看中,他開始思索,到底誰才是《老友記》中真正的主角?
是有情人終成眷屬的Ross 和Rachel 嗎?是諷刺幽默的Chandler 嗎?是潔癖星人Monica嗎?是婦女之友Joey嗎?還是我們最喜歡的歌手Phoebe?
一千個讀者就有一千個哈姆雷特,每個人對于誰是主角都有不同的答案。但是,我們可以利用數據分析出,到底是誰站在《老友記》中的C位!
為了確定這個問題的答案,Yashu Seth從GitHub中下載了《老友記》十季的劇集對白,并且用不同的參數來找出這六個人中誰是最突出的。
整個分析是使用R語言完成的,因為要涉及到將原始的對白文件轉換成結構化的表格形式,然后再進行探索性的數據分析。
你可以在GitHub中找到源代碼:https://github.com/yashu-seth/friends-analysis-blog
首先,讓我們看看每個人的臺詞。我們無法得到每個角色在屏幕中實際出現的時間,但每個人的臺詞量可以作為一個合理的估算標準,所以究竟是哪位朋友的臺詞最多呢。
Rachel 和Ross 都有9千多句臺詞,他們兩的戲份差不多。 Phoebe 說的最少,只有7400句。Chandler,Monica 和Joey 的臺詞量幾乎相同。接下來,讓我們再來看看每一季每個人的臺詞量。
這張圖給我的直觀感受就是,編導均衡分配六個朋友的臺詞。 Ross 在前三季和***一季的臺詞數最多,劇中這幾季是Ross-Rachel的感情線發展的***的時候,所以Ross臺詞最多有沒有可能是這個原因呢?
Chandler 在第四季和第六季中擁有最多的臺詞,而Joey在第五季以小優勢擊敗了他。Rachel 主宰著第七季到第九季,在幾乎所有的劇集里,Monica在六人中都有超過半數人的臺詞量。
好幾季中,Phoebe的臺詞量都最少。但她依舊用她自己的方式讓我們愛上了她,難道不是嗎?
既然我們已經看了臺詞的數量,接下來再看看所說的單詞數量是否也有相同的分布。
可以看出,單詞的數量或多或少遵循相同的分布。那么現在誰處于上位呢?Ross 和Rachel之間的競爭很激烈啊。
現在,讓我們來看看他們出現在熒屏上的次數,這里我假定一個角色只有在有臺詞的情況下才算在屏幕中出現。
數據結果非常有趣,Chandler在銀幕上出現的次數最多 ,出場次數高達1400多。Ross 和Rachel 的出場次數也不少,分別是1330次和1370次。Phoebe依舊是小可憐,出現的次數最少。
單人出場次數也是一個很好的參考指標。在這一部分中,我假定六個角色中只有一人出場的場景,此處包含其他配角的場景也計算在內。
這種情況下,Ross 顯然是贏家,這一次Rachel 與他差了一大截。
***,我們來分析一下他們在劇集標題中到底被提到過多少次。
這次Rachel 是冠軍,她總計被提到27次,排名第二的為Ross,他被提到24次。Monica 被提到次數最少,一共只提到過8次。
分析結論
讓我們來快速回顧一下。
- Rachel 和Ross 的臺詞數量最多,并且兩人之間的差異微不足道。單詞數量的情況與臺詞量類似。
- Chandler 在銀幕上的出場次數最多,Rachel 和Ross 的出場次數也處于上位。
- Ross 顯然是個人銀幕出現次數最多的贏家,Rachel與他的差了一大截 。
- Rachel 在劇集標題中提到的次數最多,但Ross只落后了3集。
Ross 和Rachel的地位真的很接近,但是Ross 在個人場景中的表現大大超過了Rachel ,因為他們在其他參數上差異很小,所以我必須把C位給Ross。
做《老友記》的數據分析真的很有趣,我發現了一些你可能會感興趣的其他事實。
- 整個系列有一個場景只有Ross、Monica、Joey和Phoebe 在場,沒有Chandler、Rachel 和其他人。這段插曲屬于“The One with the Blackout”,當時Chandler 被困在自動取款機的柜臺中。
- Chandler 和Joey作為一對,在銀幕上的出現次數最多。
- 除了6個主要角色外,Gunther的銀幕出現次數最多。
- 在所有場景中,Central Perk占16%左右,Monica的公寓占26%。
- Phoebe在Central Perk中的露面次數比其他任何人都多。場景為Central Perk時,大約三分之二的劇情里都能看到Phoebe。
毋庸置疑,Monica在她公寓拍攝的場景中出現的次數最多,其次是Chandler和Rachel。
當然拋開數據分析,我們也想知道,你心中的老友記C位到底是誰呢?
相關報道:https://yashuseth.blog/2017/12/29/data-analysis-lead-character-of-friends-data-science/
【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】