成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

給畢業生:你應該選機器學習還是數據科學?

人工智能 機器學習
本文首先分析了數據科學行業的總體發展趨勢,然后深入地比較了機器學習領域中幾個不同名稱的職位的職能,對尋找數據科學和機器學習類工作的畢業生非常有指導意義。

[[337428]]

隨著數據科學行業自 2013 年以來的爆炸式流行,該行業一直不斷地朝著更寬泛的方向發展,但同時也逐漸出現了更具體的職業角色分化。本文首先分析了數據科學行業的總體發展趨勢,然后深入地比較了機器學習領域中幾個不同名稱的職位的職能,對尋找數據科學和機器學習類工作的畢業生非常有指導意義。

大家好,我是杰森。我在硅谷工作,是一名數據科學家(關于這個名詞,我們將在本文后面進一步定義),我熱愛學習一切新事物!

引  言

說實話,這個話題在我腦海中已經縈繞很久了。但因為平時實在有太多的事情要做,我無法擠出時間來完成這項艱巨的任務。但是,如今由于新冠疫情的居家隔離令,我被困斗室,最近也快沒啥事情能讓我打發時間了,我終于下定決心來完成這個話題的寫作。

隨著數據科學行業自 2013 年以來的爆炸式流行,該行業一直不斷地朝著更寬泛的方向發展,但同時也逐漸出現了更具體的職業角色分化。在該新興行業的演進過程中,不可避免地導致了有一些崗位在名稱和職能上出現了混淆和差異。例如,許多看似完全不同的職位但卻在實際工作中扮演著相同的角色,或者有名稱相同的職位卻在實際工作中承擔著不同的角色,這些職位頭銜可能包括:

數據分析科學家,機器學習數據科學家,數據科學工程師,數據分析師 / 科學家,機器學習工程師,應用科學家,機器學習科學家……

這樣的例子簡直不勝枚舉。即使對我來說,通常招聘人員也會因為數據科學家、機器學習(ML)專家、數據工程師等不同職位的招聘而與我聯系。顯然,整個行業對這些五花八門的職位都困惑不已。造成職位名稱差異如此之大的原因之一是,實際上各個公司對數據科學的需求和用途本身就大相徑庭。但無論背后原因是什么,如今數據科學領域似乎正在不斷進行分化和合并,并逐漸形成以下幾個主要工種類別:分析、軟件工程、數據工程以及研究。 不管那些看似相似的職位是怎么命名的,通常它們都能歸類落入這些類別。這種工種細化在那些財大氣粗的大型科技公司中表現得最為真實。

在本文中,我們將首先了解數據科學行業的總體趨勢,然后更深入地比較機器學習工程師和數據科學家兩者的職能。我并不想在本文中去贅述一段漫長的發展歷史,而是選擇講述我作為一名數據科學家生活在硅谷的所聞所見。即使在 2017 那年,我寫過一篇文章“如何在還沒有獲得學位的情況下成為數據科學家”,現在和那時相比,我對數據科學的看法也發生了很大變化。

去年,我被邀請給 Metis 訓練營 學習數據科學的學生們做一個簡短的演講,我當時談到了這個話題。今天我想借用本文對這些職位的區別進行一番解釋,并幫助你找到最適合你的工作角色。也讓我們一起來看看,這個行業的發展是依然朝氣蓬勃,還是已經日暮西山,因為預測發展趨勢原本就是數據科學家的本職工作,對嗎?(也可能不是吧)。無論如何,我衷心希望本文給你帶去有用的信息。

數據科學行業的發展趨勢

在我們深入挖掘信息之前,先看看我在 LinkedIn 上找到的兩份職位描述。我已遮去了它們的職位名稱,請讀讀下面的內容,試著猜一下這些招聘廣告的原標題是什么。我用紅色標出了一些關鍵點:

去年我在 LinkedIn 上發現了這兩份職位描述。雖然有點過時了,但內容仍然貼切(資料來源:LinkedIn 和 Facebook)。

這兩份職位描述相差甚遠,是吧?但可能會讓你大吃一驚的是,這兩份職位描述都是針對數據科學家這個崗位招聘的。左邊是 Facebook 的招聘廣告,而右邊是 Etsy 的。但在這里我并不想比較哪家的職位描述寫得更好。重點是看看它們在內容上差異有多大。

以上職位描述的職位名稱。Facebook(左)和 Etsy(右)(資料來源:LinkedIn 和 Facebook)。

即使在工作中,人們也常常會因為如何定義數據科學家而展開熱議。我遇到過人們把數據科學家定義為 計算機科學專業的博士 或 新數據分析師。這其實是因為不同的公司對不同的職位都使用了數據科學家這樣一個相同的術語。然而,我相信經過這么幾年發展,這個行業應該有更細的分工以及更具體的職位定義,而不是把所有的東西都籠統地塞進數據科學這一廣泛范圍里。

那么,在數據科學家這個已經被濫用的職位名稱下,實際上可能暗指哪些不同的具體崗位呢?在很大程度上,我認為這個職位有可能指的是 軟件工程師、數據分析師、數據工程師和應用 / 研究科學家。我知道有不少朋友頂著相同的數據科學家頭銜,但在實際工作中他們的角色是上述四者之一。請看看下面我創建的圖表。在數據科學發展的早期,一名數據科學家的工作內容可能的確包含了這四個角色的職能。然而,如今的職位正變得越來越具體和細化,正如下圖所示。

數據科學家工作內容發展趨勢(資料來源:本文作者)。

《哈佛商業評論》預見了這樣的發展嗎?

這種發展趨勢令人驚訝嗎?根據 2012 年《哈佛商業評論》(Harvard Business Review)雜志上那篇著名的文章《數據科學家:21 世紀最令人稱羨的工作》,這樣的發展趨勢也并不足以為奇:

數據科學家最基本、最通用的技能是編寫代碼的能力。但在五年后,這一點可能就會發生變化,因為會有更多的人會在他們的名片上印上“數據科學家”的頭銜。

正如這篇文章所描述的,如今作為一名數據科學家,你并不一定非要成為一名優秀的程序員。那是因為,以前用來分析大數據的工具和方法并不是那么隨處可得且用戶友好。這就要求從前的數據科學家在擁有其他技能的同時還需要具備較強的工程技能。但是用于機器學習和數據科學的工具發展十分迅速,現在比以往任何時候都更容易獲取這些工具,因此你只需幾行代碼就可以訪問使用最先進技術(State of the art,SOTA)的模型。這使得以前的數據科學家角色如今更容易分拆成為分析師或工程師。現在,我們不必像以前那樣,需要全面掌握所有分析、工程和統計知識才能成為一名數據科學家。

例如,Facebook 就引領了這一趨勢的變化,讓過去的數據分析師的工作角色變成了數據科學家。這是一個自然的演進過程,因為隨著數據量的增加以及數據問題變得更具挑戰性,執行良好的數據分析需要更多的專業技能和培訓。不僅僅是 Facebook,像蘋果和 Airbnb 這樣的公司也已經開始明確區分數據分析師 / 產品數據科學家和機器學習數據科學家這樣的角色崗位。

公司規模如何影響崗位的分化

值得一提的是,這樣的角色崗位細分更多發生在規模較大的科技公司。數據科學家這個角色和軟件工程師還是有很大差異的,固然各種大小規模的科技公司都需要軟件工程師,但并不是所有公司都需要專業的研究科學家或機器學習工程師。許多公司擁有幾名數據科學家可能就足以運轉業務了。所以在小公司里,可能仍然會有一些數據科學家同時扮演上述四個角色。

根據一般的經驗而言,大公司(FANG 四巨頭:Facebook,Amazon,Netflix 和 Alphabet)的數據科學家職能通常類似于高級分析師,而小公司的數據科學家扮演的角色更類似于機器學習工程師。當然這兩種職能對于公司來說都是重要和必需的。接下來,我將繼續沿用這里我的新定義,即下文每當提及數據科學家時,意味著這是一個分析師角色。

數據科學家分化出的不同角色以及如何選擇

在下面的圖表中,我試圖展示一個與上面的圖表類似的圖,但對這四種功能增加了更詳細的描述。這些描述內容可能并不算完美,但你可以把它們作為參考。

數據科學家職能的四大支柱(資料來源:本文作者)。

求職——應該選擇哪個職位以及如何準備面試?

如果你試圖進入這個領域,無論是當一名機器學習工程師還是數據科學家,你可能首先想知道的是自己究竟應該選擇哪一個崗位。請讓我列出四個與機器學習相關的主要崗位簡化的(但也是約定俗成的)描述,以幫助你弄清楚這些職位到底是干什么的。雖然我個人在工作中并沒有將所有這些職位都嘗試干過一遍,但我從工作在各個領域的朋友那里學到了很多有用的知識。我還在以下描述中的括號里提供了可能的面試內容(假設是典型的四輪面試)。

  1.  數據科學家: 你想分析大數據、設計實驗和 A/B 測試、構建簡單的機器學習和統計模型(例如使用 sklearn)來推動商業策略的運籌帷幄嗎?這個角色的工作不會特別結構化,會包含較多的不確定性,你需要能夠獨當一面地去主導項目的表述。(面試:1 輪概率 / 統計,1 輪 Leetcode 編程,1 輪 SQL,1 輪機器學習。)

       2.  機器學習工程師: 你想在實際業務中構建并部署最新的機器學習模型(例如 Tensorflow,,PyTorch)嗎?你工作的重點不僅是構建模型,而且還需要編寫軟件以運行和支撐你的模型。在這個職位上,你更像是一個軟件工程師。(面試:3 輪 Leetcode 編程,1 輪機器學習。)

       3.  研究科學家: 你有計算機科學專業的博士學位,并在 ICLR 國際會議上發表過幾篇機器學習相關的論文嗎?你是否致力于突破機器學習的研究前沿,當你的論文被別人引用時會感到興奮不已嗎?能做到這些的人的確是鳳毛麟角,相信如果能做到這些,你已經很明確自己想干什么樣的工作了。而這類人才中的大多數最終都進入了谷歌或者 Facebook。而且,即使沒有博士學位也可以進入這個行業,但這樣的情況少之又少。(面試:1 輪 Leetcode 編程,3 輪機器學習 / 研究。)

       4.  應用科學家: 你是機器學習工程師和研究科學家的混合體。所以這個角色不僅要關注編程,還需要去使用和推進最前沿(SOTA)的機器學習模型。(面試:2 輪 Leetcode 編程,2 輪機器學習。)

顯然,以上這些描述并不算面面俱到。但當我和朋友聊起相關職位,看過很多工作描述后,我發現上述這些觀點還是普遍適用的。如果你對自己想要申請的職位還是有些不太確定,這里我還有一些建議可以幫助你進一步了解工作職位:

  •  閱讀職位描述:說實話,職位頭銜并不重要。這些職位統統可能都被冠以相同的“數據科學家”字眼,但工作角色描述可能相去甚遠。
  •  挖掘 LinkedIn:如果你不確定蘋果公司招聘的數據科學家是什么樣的角色,只要看看蘋果公司的數據科學家在 LinkedIn 上有什么樣的專業背景就可以了。他們是否大多都是計算機科學專業的博士?或者是本科生學歷?他們都接受過什么樣的專業培訓?這些信息將有助于你了解更多。
  •  面試:如果你認為你應聘的職位是一個技術崗位,但在面試過程中卻沒有遇到任何編程技術面試,那你多半不會在此得到一個技術職位。通常你的面試內容就反映了工作的性質。

機器學習工程師 vs 數據科學家

好吧,已經說得夠多了。現在回到我們的話題上來。近年來,我開始聽到人們對數據科學工作的負面評價越來越多。造成這種情況的幾個原因是,越來越多冠以“數據科學家”的工作崗位貌似并不像從前一樣包含許多高端的機器學習成分,而且這樣的職位似乎比以前更容易獲得。也許五年前,大多數招聘崗位描述會要求至少有碩士學位才能應聘數據科學家的工作,但現在情況已經大不一樣了。不管人們如何揣測數據科學(至少在過去日子里)熱度已過的原因,請讓我們先來看一些實際數據。

下面的數據和圖表來自世界著名的薪資數據庫搜索引擎,Salary Ninja。它根據 H1-B 數據庫中全美的外籍員工的信息進行搜索。你會看到 2014 年至 2019 年,職位名稱中含有“數據科學家”或“機器學習工程師”的職位的數量和平均工資。

比較數據科學家和機器學習工程師的工作機會變化趨勢(資料來源:本文作者)。

你對這一結果感到驚訝嗎?盡管這兩個職位的平均工資大致差不多,但你可以看到數據科學家的平均工資在 2015 年和 2016 年有所下降。大概這就是人們所說的,數據科學家的好日子一去不返了吧。但就純粹工作數量而言,數據科學還是遠遠大于機器學習工程,但你可以看到相比之下機器學習工程師工作數量的增長速度更快,且平均薪水也更高。

為了方便你閱讀,我在下面總結了從 Salary Ninja 收集的本文討論的幾個角色的統計數據。第一張表展示了過去六年的統計,又抽出其子集在第二張表里僅展示了 2019 年的最新數據統計。最后,我列出了微軟這一家公司六年以來的數據統計。

幾個與機器學習有關的職位的簡要統計(資料來源:本文作者)。

從以上數據中,我得出有趣的幾點見解:

  •  總體而言,數據分析師的人數要多于數據科學家,但 2019 年情況卻出現了逆轉!這是否意味著數據分析師的職位正被很多公司重新冠名為數據科學家?
  •  機器學習工程師的薪水略高于數據科學家,但實際工作中機器學習工程師的職位數量要少得多。這是因為機器學習工程師的正式頭銜通常就是 軟件工程師。
  •     而研究科學家的平均薪資水平低得令人驚訝。我發現這是因為該數據庫可能包括了許多其他類型的研究科學家,而不僅僅是那些在機器學習技術領域做研究的人員。這就是為什么我特意只選了一家科技公司列了第三張表格,以減少此類干擾。正如預期的那樣,在微軟公司里研究人員占據了最高薪酬的寶座。
  •  然而,我還是被數據工程師 130 萬美元的最高年薪震驚了。這簡直是太瘋狂了!也許你應該考慮一下該職位。
  •  請記住,該數據集只包含底薪,而如今在科技界,股票也常常扮演著重要角色。此外,它也遠沒有描繪出就業市場的全貌。然而,考慮到美國科技行業的外籍員工數量,這仍然算是提供了一個很好的參考指標。

根據這些數據,我認為,也不能就武斷地說數據科學行業已經走向蕭條。這個行業仍在增長,但今后可能會更加專注于分析方向。根據我的觀察,如今似乎有更多數據科學領域的工作崗位降低了準入門檻,但這也并不算是一件壞事。

結  論

到這里,本文已經講了很多,但我仍希望你能讀完最后這一部分。我寫這篇文章是因為,面對這個行業正在發生的所有變化,我自己也常常感到困惑。而且,人們似乎對什么是數據科學有太多五花八門的看法。無論誰對誰錯,我希望你能看到發展的趨勢,并自己做出決定。

最后,不要因為一個工作或行業的平均薪酬較高或熱度較高就輕易地對它做出選擇。你的頭銜是數據科學家、機器學習工程師還是數據分析師,這些并不重要。如果有人說數據科學家其實就是工程師,或者就是分析師,這些也不重要,因為這兩種說法都可能是對的。

雖然很容易根據薪水高低來比較職位頭銜,但選擇一個你喜歡并且擅長的職位才是真正重要的事情。請專注于你所做的實際工作,并確保這份工作與自己契合。別因為平均工資看上去較低就產生錯誤的印象,這并不一定意味著你的實際工資會比別的工作低。正如你在前面表格中看到的,本文討論的所有職位它們的最高年薪都相當地高。

在我結束本文之前,還有一些其他的資源和更多的信息可以供你參考:

  •  Airbnb 曾經發過一篇文章“數據科學,同一職稱多種職能”:我認為 Airbnb 在組織數據科學相關的各種工種方面確實做得非常棒,這篇文章對此進行了詳細的解釋。他們并沒有給大家統一地冠以一個含義模糊的數據科學家頭銜,而是細分為三個不同的方向:分析、算法和推理。

文章地址:https://www.linkedin.com/pulse/one-data-science-job-doesnt-fit-all-elena-grewal/

  •  Joma 在 YouTube 上發布的視頻 “一位數據科學家告訴你:到底什么是真正的數據科學?”:他很好地根據公司規模大小解釋了不同類型的數據科學家。通過這段視頻,你還能對在大型科技公司工作的分析數據科學家角色有更多了解。

視頻地址:https://www.youtube.com/watch?v=xC-c7E5PK0Y&feature=youtu.be&t=372

再次感謝你的閱讀。希望這篇文章能給你一些啟示,這樣你在研究數據科學和機器學習的時候就不會感到迷茫。衷心祝愿你在這段艱難的日子里一切順利,并希望本文對你有所幫助。 

 

責任編輯:龐桂玉 來源: AI前線
相關推薦

2019-12-31 09:39:41

機器學習人工智能計算機

2017-06-04 10:36:24

數據科學機器學習

2012-12-28 14:50:52

應屆畢業生

2012-12-29 14:29:12

應屆畢業生求職

2020-12-16 09:18:38

數據科學數據大數據

2015-06-25 13:11:05

數據大學畢業生

2009-02-26 10:33:08

面試求職計算機專業

2010-05-25 10:44:42

畢業生求職陷阱

2010-10-18 11:26:48

職場

2010-05-27 10:10:07

職場經驗

2022-04-11 00:06:19

開發服務架構

2012-12-27 15:14:18

應屆畢業生簡歷

2009-08-24 09:24:43

2009-09-02 13:19:40

應屆畢業生北京求職

2012-12-29 16:20:55

應屆畢業生求職

2009-02-17 11:52:44

2017-09-11 15:46:36

數據科學語言Java

2022-08-16 09:34:50

程序員技術

2011-11-14 09:48:29

IT計算機技能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩不卡在线观看 | 成人黄色电影免费 | 黄色激情毛片 | 69av网 | 亚洲福利一区 | 国产精品毛片一区二区三区 | 国产欧美在线视频 | 亚洲三级在线观看 | 爱爱无遮挡 | 精品视频一区二区三区在线观看 | av在线免费观看网站 | 中文字幕在线一区二区三区 | 精品成人免费视频 | 久久久久电影 | 久久国品片 | 国产精品一区二区av | 91久久国产综合久久91精品网站 | 日韩欧美在线观看 | 亚洲天堂999 | 羞羞羞视频| 激情 婷婷 | 91在线中文字幕 | 色偷偷噜噜噜亚洲男人 | 成人免费av在线 | 风间由美一区二区三区在线观看 | 九九一级片 | 成人在线免费观看 | 亚洲精品68久久久一区 | 久久久妇女国产精品影视 | 99视频在线免费观看 | jizz在线免费观看 | 日韩综合一区 | 一级片在线观看 | 美女毛片| 国产精品视频导航 | 日日干夜夜操 | 欧美精品一区二区三区在线播放 | 日韩在线电影 | 亚洲欧美国产一区二区三区 | 伊人网国产 | 看片91|