前車之鑒:我在數據科學職位面試中犯過的5個錯誤
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)
我曾經多次參加面試,卻總是與offer失之交臂,后來我才發現,我在面試過程中反復地犯了幾個關鍵錯誤。我從中吸取教訓,最終獲得了一些數據科學家崗位的入職邀請。
我會特別標出數據科學家要注意的錯誤,這些也幾乎是所有面試要注意的。希望各位免受面試和犯錯的煎熬,專注于提升面試技巧,一舉拿下心儀公司的數據科學家崗位。
談論同一個項目
面試數據科學家時,面試官們總會問相似的問題。我原來認為要用一致的答案回復所有人,甚至覺得可以回溯引用同一個項目回答新問題。但請謹記,所有的面試官會在面試結束后相互討論。這就意味著他們會認為你只會用同一個教育背景或者專業的數據科學項目來應對所有問題,從而做出片面的評價。
總談論同一個項目會使你看起來經驗不足,我就是活生生的例子。面試官說我不斷地講同一個案例,他們想了解其他的情況,以及我是如何處理這些問題的。
我認為用相似的答案回答類似的問題不一定是大錯——這種情況下,要確保每個提問的面試官能聽到你補充的新細節。但這個問題需要引起你的重視。
不知道是否所有公司都這樣認為,因為我往往對某個特定的項目感到自豪并且會引用它來回答每個新問題。此外,基于同一個案例給出的答案也能讓面試官全面了解我作為一名數據科學家的資質。
我的問題出在所有答案太過相似,仿佛在過去一年中僅完成了一個項目,這樣當然無法打動面試官了。很難說這是一定要克服的問題,但別人提醒過我這是一個錯誤,所以我吸取了教訓并在下次面試時改進了。
沒有問足夠多的問題
圖源:unsplash
這一問題廣泛存在,并且大多公司應該也視其為失誤。沒有提出足夠的問題說明你:
- 對公司不感興趣
- 不夠專注導致提不出問題
- 過于自信
- 不好共事
沒有人想和自以為是的人共事,那些對公司、公司目標和相應數據科學項目不感興趣的人同理。最重要的是,提不出足夠的問題時,你很像是不愿聆聽。不僅適用于數據科學家,所有職業領域都是如此。
自認為面試官知悉我的過往經驗
我常在面試和講故事的時候犯這個錯誤。面試和講故事其實是一回事兒。我常常認為面試官了解我的項目背景信息。但他們很可能什么都不知道,有些甚至不會看你的簡歷。
這話也許會令你震驚,但真的只會有幾個公司認真閱讀你的簡歷——但不意味著面試前可以不管簡歷了,因為面試官可能會就簡歷上的案例詢問細節。再說講故事,在回答問題的時候你需要設定場景,給出所做項目的基本信息,告訴面試官你可以與股東和非數據科學領域人士共事。
應提及的關鍵信息:
- 商業問題是什么?
- 為什么想做這個項目?
- 參與者有誰?(產品經理,軟件工程師等)
- 過程如何?
- 如何完成的?
- 在宏觀商業計劃中有何作用?
- 結果如何?
- 完成度如何?
- 幫助到了多少人/節約了多少資本/節約了多少時間?
沒有考慮業務影響
圖源:unsplash
承接上文的講故事,你需要確定自己的模型能帶來的業務影響。這是數據科學家常犯的錯誤,因為他們只關注自己的模型及其表現,卻忽視了業務影響。你需要用精準且有“影響力”的方式重點介紹結果。很可能項目結果非常有影響力,但沒能告知面試官。
你可以這樣措辭:“我做了一個決策樹模型,將人工流程自動化,節省了50%的時間和50%的成本,為優化產品提供了時間和資本。”
如果不斷強調99%的準確率卻不提商業影響,面試官會認為你不適合企業,更適合學術。有時,如果整個過程在某種程度上更快、更有影響力,即使降低精度也可以。假設你是雇主,你會想知道誰對企業有用。
沒有概述整個數據科學過程
這一點和第一點都是別人提醒過我的——沒有概述整個數據科學流程,意思是我在談論時缺少了主要數據科學項目前后的數據工程和機器學習的組成部分。
面試官想知道:
- 數據如何得來?
- 怎樣預處理?
- 根據面向對象編程原則對項目做出了什么改變?
- 怎樣做的測試?
- 怎樣部署?
- 怎樣與產品融合?
這些觀點可能不是你的一手經驗,但是面試官明白,數據科學家不會同時是該項目的數據工程師,機器學習工程師或軟件工程師。他們只是想知道你是否了解全部流程以及各個步驟由誰完成。如果正確回答了這個問題,你在公司的眼里是更為專業的數據科學角色,并且可能會學習數據科學過程的開始或結束部分。
圖源:unsplash
避免了這些錯誤也不能保證你能收到職位的邀請,但它們可能以某種方式起到效果。理解這些觀點,能幫助你更好地應對面試中的問題。