成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

沒有數據的數據科學?請盡早聘用數據工程師

大數據
離開了數據,數據科學家的存在毫無意義。這可不是件個例。本文將討論一些胸懷大志的數據科學家們(以及他們將來的雇主)真正需要了解的事情。

本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。

“這一刻你正在應對什么挑戰?”這位前研究學者回應道:“嗯,我好像應聘成為首席數據科學家了,在一個沒有數據的公司里。”

這件事讓人啼笑皆非。離開了數據,數據科學家的存在毫無意義。這可不是件個例。本文將討論一些胸懷大志的數據科學家們(以及他們將來的雇主)真正需要了解的事情。

[[357800]]

什么是數據工程?

如果數據科學是讓數據變得有用的一門學科,那么可以想像數據工程是將數據變得能用的一門學問。數據工程師們是提供幕后基礎設施支持的英雄們,這些基礎設施讓機器能夠記錄工作,讓海量的數據與數據科學工具包兼容儲存。

[[357801]]

圖源:LinkedIn

與數據科學家不同,數據工程師們更傾向于不花費那么多的時間研究數據。與此相反,他們研究并處理那些承載數據的基礎設施。數據科學家是數據的管理者,而數據工程師們是對數據管道進行管理的人。

沒有數據的數據科學?請盡早聘用數據工程師

圖源:hackernoon

數據工程有三種主要工作方式:

  • 使數據大規模地儲存(數據庫)和傳輸(數據管道)。
  • 維護那些支持企業運作的數據流。
  • 為數據科學提供數據集。

如果沒有數據,你無法研究數據科學。如果你被一個沒有數據和數據工程的機構聘用為數據科學總監,猜猜誰將會成為一名數據工程師?

數據工程的艱難之處在哪?

食品進購是件簡單的事,如果你只是煮你一個人的晚餐還好說,但規模擴大會將這件瑣事變得復雜無比——你該如何獲得,存儲和處理20噸的冰淇淋,且讓它一點都沒有融化?

相似地,“數據工程”在你為學校項目下載一個小的電子數據表時是相當容易的,但當你在處理千萬億字節規模的文件時就會讓人頭暈眼花。規模使其本身成為一個復雜的工程學科。

[[357802]]

圖源:pixabay

不幸的是,了解這兩個學科其中之一并不代表著你就對另一個的知識有所了解。

如果你有了跑去學習兩個學科的沖動,你可能成為了那個(令人倍有壓力且適得其反的)信念的受害者——數據專家們必須對數據的所有事項都有所了解。數據宇宙正在飛速地擴展著,現在是時候讓人們意識到這個領域有多么廣闊了,在數據領域的某個領域工作并不自動要求人們去成為全知全能的專家。

講這么多就是為了說明,這門學科包含了太多的知識,以至于最有決心的天才也無法全部理解和掌握。與其希望數據工程師們全知全能,不如問問彼此(也問問自己),“你是哪一類人?”讓我們齊心協力一起工作,而不是在這條路上孤軍奮斗。

但這不是一個絕佳的學習機會嗎?可能是。這取決于你對已知的學問有多大的感情。數據工程不同于數據科學,所以如果你是個未經受過數據工程訓練的數據科學家,那么你得從零開始。

這可能正是你所尋求的樂趣——只要你帶著開放的眼光一路前行。建立你的數據工程團隊可能要花費好幾年的時間。當然,有理由去學習新事物是件好事,但相同的是,你的數據科學“肌肉”可能會因此萎縮。

作為一個類比,想象你是一位能流利使用英日兩語的譯者。你被提供了一個叫做“譯者”的職位。當你來到崗位工作時,你發現你被聘來進行將普通話譯為斯瓦希里語的工作,而這兩種語言你都不會說。抓住機會成為一個四語達人可能是一件振奮人心且有益的事情,但請從現實的角度來思考你該如何有效地利用初級培訓。

換句話來說,如果一個公司沒有任何的數據或者數據工程師,那么接受首席數據科學家的工作會在你組建數據工程團隊時,為了成為一個數據工程師(你很可能還未達標),將你的數據科學家生涯擱置好幾年的時間。

最終,你會很驕傲地看著你所建的團隊,然后意識到你不再需要親自去處理那些細枝末節。那時你的團隊已經能夠成熟應對那些絕妙的神經網絡或者你讀博時研究的復雜巧妙的貝葉斯定理推論,你就只能袖手旁觀,看著他人完成目標。

[[357803]]

給你一些小建議

(1) 弄清你正在接手的事物

如果你在考慮接受一個成為數據科學總管的工作,你第一個應該提出的問題是:“誰來保證我的團隊有數據能研究?”如果答案是你,嗯,至少你將知道自己的簽約將意味著什么。

(2) 請記住你是顧客

既然數據科學受數據支配,只有數據工程師們作為同事可能并不夠。如果那些同事們沒能將你認定為他們工作的一個關鍵客戶,你將面對的是一個艱難的斗爭。如果他們的態度讓你更多的感受到自己是一個博物館策展人,為了數據而保存數據,那這可不是一個好兆頭。

(3) 要有全局觀

誠然你是數據工程師們的關鍵客戶,但很可能你并不是他們的唯一客戶?,F代企業使用數據推動業務發展,通常情況下,無需人為干預,數據就能很好地運轉。當你對公司的貢獻只是“可有可無”時,表現得好像世界都是圍繞著你和你的團隊轉的,這是不明智的。

(4) 堅持問責

在登記你新的十億字節之前,考慮與數據工程同事協商,讓他們對與你的合作負責。如果他們沒有將你拒之門外的反應,你的團隊就不太可能蓬勃發展。

 

責任編輯:趙寧寧 來源: 讀芯術
相關推薦

2019-02-25 22:57:22

數據工程師數據科學機器學習

2012-12-24 09:54:06

大數據數據科學家

2019-04-26 14:27:07

大數據數據科學數據工程師

2018-08-19 15:39:56

數據分析數據科學數據工程師

2020-07-19 15:17:41

機器學習技術工程師

2020-03-13 14:13:48

機器學習數據科學編程

2020-12-23 07:56:13

數據科學數據工程技術

2023-03-11 22:10:20

數據工程師算法數據庫

2018-11-15 15:55:44

前端工程師Web云計算

2018-03-20 13:04:55

GDPR數據科學數據保護

2023-11-02 11:49:22

2020-04-29 13:45:42

機器學習ML數據科學家

2020-05-29 10:16:45

數據科學數據科學家軟件工程師

2020-09-19 17:40:29

編寫代碼工具技術

2021-01-25 21:49:35

數據科學數據分析IT

2011-05-24 10:01:21

SEO

2015-09-25 09:25:34

數據分析

2023-03-09 09:38:01

數據科學

2024-01-30 17:46:24

2011-03-30 15:17:45

數據中心
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲成人精品 | 亚洲精品大全 | 中文字幕第九页 | 99热播精品 | 日本成人免费网站 | 成人在线播放网站 | 亚洲精品电影在线观看 | 久久中文免费视频 | 亚洲一二三区在线观看 | 老头搡老女人毛片视频在线看 | 精品在线一区 | 亚洲精品免费观看 | 亚洲a在线观看 | 天天曰天天干 | 亚洲一区二区三区国产 | 精品国产色 | 免费观看一级视频 | 黄色播放 | 97人澡人人添人人爽欧美 | 黑人粗黑大躁护士 | 国产免费一区 | 久久久性色精品国产免费观看 | 国产精品福利网站 | 91精品麻豆日日躁夜夜躁 | 91精品久久久久久久久中文字幕 | 日韩精品专区在线影院重磅 | 夜夜操操操 | 亚洲精品久久久久久久久久久久久 | 久久狠狠 | 国产中文字幕在线 | 农村妇女毛片精品久久久 | 色眯眯视频在线观看 | 国产福利二区 | 国产乱一区二区三区视频 | 久久新视频 | 久久亚洲国产精品日日av夜夜 | 国产伦精品一区二区三毛 | 成人三级在线观看 | 欧美成年网站 | 一区福利视频 | 久久国产精品一区二区三区 |