成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

在小公司如何做一名成功的數(shù)據(jù)科學(xué)家?

大數(shù)據(jù) 數(shù)據(jù)分析
小公司需要數(shù)據(jù)科學(xué)家么?可能只有長期混跡數(shù)據(jù)圈的老司機才有資格回答這個問題。作者是社會科學(xué)出身,有一些自然語言處理,應(yīng)用數(shù)學(xué)和工商管理經(jīng)驗。總而言之,什么都會一點。以下是他關(guān)于此問題的看法。

[[257394]]

大數(shù)據(jù)文摘出品

來源:medium

編譯:王媛媛、劉思佳

小公司需要數(shù)據(jù)科學(xué)家么?

可能只有長期混跡數(shù)據(jù)圈的老司機才有資格回答這個問題。

本文作者Randy Au,已經(jīng)在15-150人規(guī)模的公司工作了近12年,被冠于“數(shù)據(jù)分析師、工程師、偶爾還有科學(xué)家”的各種頭銜。

作者是社會科學(xué)出身,有一些自然語言處理,應(yīng)用數(shù)學(xué)和工商管理經(jīng)驗。總而言之,什么都會一點。

以下是他關(guān)于此問題的看法:

成為***個“數(shù)據(jù)全能選手”

[[257395]]

小公司不需要數(shù)據(jù)科學(xué)家,但他們需要一個“數(shù)據(jù)全能選手”。他們可能稱這項工作為“數(shù)據(jù)科學(xué)家/工程師/分析師/忍者”,諸如此類。

一家20-60人規(guī)模的公司,有足夠的客戶,豐富的數(shù)據(jù)和專業(yè)化的崗位,只需要招一個能夠使用數(shù)據(jù)來提供有用的業(yè)務(wù)洞察力的人。

職位的頭銜不重要,但職位描述往往是各種各樣的混合:

  • 理解我們擁有的數(shù)據(jù)
  • 幫助構(gòu)建我們的數(shù)據(jù)系統(tǒng)
  • 幫助我們進行數(shù)據(jù)驅(qū)動/運行實驗
  • 發(fā)展業(yè)務(wù)
  • 可能與任何事物相關(guān)或不相關(guān)的教育/認證

通常情況下他們并不完全了解需要怎樣的人才。只有一種普遍意義上的“我們有數(shù)據(jù),看起來很有用,但是缺少轉(zhuǎn)化為價值的技能。”

實際上,在這個職位上的人需要同時做兩件大事:

  • 今天-幫助公司取得成功
  • 明天-打造數(shù)據(jù)驅(qū)動型公司

今天-幫助公司取得成功

[[257396]]

初創(chuàng)公司充滿了不確定性。他們不確定客戶是誰,生產(chǎn)系統(tǒng)可能很困難,不知道客戶對產(chǎn)品做了什么,不知道如何使用擁有的數(shù)據(jù)做出決策,不知道擁有的數(shù)據(jù)是否有用。

對問題的巧妙回答可以帶來更明智的決策,并希望每個人都夢想成為神話般的曲棍球棒。難題是大多數(shù)問題都不適宜用花哨的方法。有用的通常是老辦法和基于定性方法而不是定量。

在優(yōu)化現(xiàn)有流程時,大多數(shù)DS方法都是***大的,它們可以在獲取客戶,轉(zhuǎn)化客戶,客戶粘度和客戶支出等方面實現(xiàn)5%,10%甚至25%的增長。A / B測試,推薦系統(tǒng),ML分類器,所有這些都有助于優(yōu)化。收益是真實的,可量化的,并且可能是顯著的,但早期可能會更重要的事要做。

早期***的影響往往是業(yè)務(wù)洞察。洞察力從根本上改變了公司做的事情。它們來自很常見的事情,例如研究用戶偏好/行為,為銷售人員揭示新的營銷概念,或幫助產(chǎn)品團隊意識到Twitter上最受憎恨的功能實際上被90%的付費客戶使用。

我對“幫助公司”角色的看法是:“數(shù)據(jù)全能選手”是一種力量倍增器 。企業(yè)內(nèi)部的人有問題,工作就是幫助他們解決問題。

成為***個“數(shù)據(jù)全能選手”=成為“有數(shù)據(jù)的科學(xué)家”!

作為一名科學(xué)家對我來說意味著你遇到一個難題,一個研究型問題,你可以用任何方法來找到對這個問題的堅實答案。

作為數(shù)據(jù)科學(xué)家,我們傾向于使用定量方法和從系統(tǒng)收集的數(shù)據(jù)來回答問題,但這不是獲得洞察力的唯一途徑。有時你精盡全力觀察或詢問用戶(定性方法),或者你出去收集數(shù)據(jù)(實驗和調(diào)查),或者你盯住別人(競爭分析)。

一個好的科學(xué)家不會通過他們的方法來定義自己,***個數(shù)據(jù)全能選手(或者任何數(shù)據(jù)全能選手)也不會。

我們的目標(biāo)是滿足緊迫的業(yè)務(wù)需求:“為什么沒有人使用我們的產(chǎn)品?”“我們的回報怎么這么高?”我們是否應(yīng)該進行這種昂貴的銷售呢?““是什么導(dǎo)致客戶流失?”“什么是客戶的終身價值,是什么推動了這一點?”

明天-打造數(shù)據(jù)驅(qū)動型公司

我看到的一個常見的陷阱是來自數(shù)據(jù)科學(xué)計劃的人加入這些職位,期望使用像Spark這樣的性感東西并應(yīng)用RNN來完成他們的工作。但很遺憾,不匹配是非常殘酷的。

花哨的“數(shù)據(jù)科學(xué)”方法依賴于大量的東西,不要指望每一層在移動到下一層之前都“完成”。把顏色想象成“ 花費的時間”。

作為***個被雇用為處理數(shù)據(jù)的人,金字塔的任何一層都不太可能是堅固的。這是一個多年,跨職能,全公司的努力才得以實現(xiàn)。并行培養(yǎng)這些技能是工作的重要部分。

請注意,在典型的業(yè)務(wù)中,無論底層的穩(wěn)定性如何,你都會嘗試同時在金字塔上下執(zhí)行操作。我已經(jīng)為脆弱的新系統(tǒng)構(gòu)建了大量的儀表板和分類器,你也會這樣做。

固態(tài)生產(chǎn)系統(tǒng)和工程實踐

比如在一個堅固的“工程駕駛室”,如果系統(tǒng)出現(xiàn)故障,而且無法獲得真正測量系統(tǒng)的行為,這時候此會希望根據(jù)需要提供幫助。

你擁有的“數(shù)據(jù)工程師”頭銜越多,在幫助構(gòu)建堅固系統(tǒng)方面所扮演的角色就越重要。人們自然會問你關(guān)于輸入的問題,如PostgresSQL vs MySQL,AWS vs GCP,Spark vs Redshift等,幫助這些可以增加持久延續(xù)的價值。如果沒有足夠的Eng資源則必須自己來設(shè)置系統(tǒng)并運行它們。

可靠的儀器儀表

獲得可靠的儀器數(shù)據(jù)人員最關(guān)鍵的事情。這是一個無休止的程序,從挑選框架(多個)到收集系統(tǒng)和用戶數(shù)據(jù),確保工程師學(xué)習(xí)如何實現(xiàn)事物而不計算錯誤,確保數(shù)據(jù)庫和日志正在做正確的事情(TM),并確保你在計算你認為正確的東西。

同時專門添加系統(tǒng)用來收集和報告數(shù)據(jù),這些將需要由某人(也許是你)組合和管理。

在文化方面,會不斷有人來詢問數(shù)據(jù)的可靠性以及如何處理這些信息,他們會要求解釋和深度剖析系統(tǒng),直到他們自己非常了解。

當(dāng)你制作報告時,這種文化培訓(xùn)本身就是一個漫長的過程,人們發(fā)現(xiàn)與其他系統(tǒng)不一致并且得到的結(jié)果與他們對現(xiàn)實的看法不相符時,可能現(xiàn)實是錯誤的,也可能是正確的。

報告和處理數(shù)據(jù)

儀表板和報告不是一項有趣的工作,更不幸的是,它通常是整個公司人員每天觀察公司健康狀況的唯一方式,因此投資是必要的,目標(biāo)是把可操作的信息交給可以采取行動的人。

一開始,大多數(shù)儀表板和報告都是手動的,需要大量的迭代才能達到需求。雖然,自動化是一個很好的選擇,但洞察力也是需要著重考慮的。

技術(shù)方面并不復(fù)雜,有許多服務(wù)平臺可用于生成報告和儀表板,同時甚至可以使用自定義代碼執(zhí)行操作。

訣竅是讓所有數(shù)據(jù)系統(tǒng)一起玩(HaHa),并在業(yè)務(wù)增長時最小化維護儀表板和報告的成本。

文化方面是事物有趣的地方。當(dāng)你正在訓(xùn)練在這里的人們變得更加數(shù)據(jù)化,這也需要多年的工作和實踐。

這里涉及大量的教育。你將教人們?nèi)绾伍喿xA / B測試的結(jié)果,重要的差異意味著什么,解釋信心或預(yù)測間隔是什么,解釋為什么該圖表“只是一個估計。你會提出有關(guān)樣本量的問題,并且經(jīng)常需要教會處理問題的方法。

如果人們關(guān)注儀表板上的數(shù)字,人們應(yīng)該怎么做?就個人而言,我告訴他們來跟我討論。他們的擔(dān)憂可能是一個研究問題(或一個錯誤),而這就是研究“黃金”。這些人是這部分業(yè)務(wù)的領(lǐng)域?qū)<遥抑皇且粋€用SQL的書***。

自動化與實驗

[[257397]]

隨著時間的推移,你將設(shè)置新功能何時消失的指標(biāo)和儀表板。人們不可避免地會對功能的表現(xiàn)感到失望。

一旦人們習(xí)慣了獲取信息并且可能會運行一些A / B測試用來使結(jié)果令人失望,那么當(dāng)測試數(shù)據(jù)與人們的假設(shè)相反時,就會花費大量時間來驗證數(shù)字是否正確。

有用的儀表板應(yīng)該高度自動化,人們習(xí)慣使用數(shù)據(jù)來做出決策。

另一件有趣的事情我注意到,不管結(jié)果如何,在這個階段,公司可以順利地運行實驗。他們學(xué)會設(shè)計他們知道自己會成功的測試(低風(fēng)險),或者他們會“測試”他們100%知道他們將會發(fā)布的事情。

現(xiàn)在,作為科學(xué)家你可以通過這種行為呼喚人們。無論測試結(jié)果如何,它們都可以完全啟動。雖然激進的變化往往測試不佳,但應(yīng)該明確說明意圖。

***,數(shù)據(jù)科學(xué)

在經(jīng)過漫長的旅程之后公司本身已經(jīng)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動。他們有假設(shè)能夠可靠地收集數(shù)據(jù),并根據(jù)結(jié)果做出深思熟慮的決策。他們也更自給自足,可以閱讀(并且可能創(chuàng)建)帶有一些指導(dǎo)的儀表板,并且學(xué)會了何時擔(dān)心以及如何提出問題。

在金字塔下面總會有更多事情需要做,但至少現(xiàn)在事情并沒有隨時發(fā)生。

現(xiàn)在你可以考慮打破花哨的算法......

或者也許有一個需要構(gòu)建的數(shù)據(jù)倉庫,因為你現(xiàn)在有太多系統(tǒng)導(dǎo)致分析查詢無法進一步加速。

相關(guān)報道:

https://towardsdatascience.com/succeeding-as-a-data-scientist-in-small-companies-startups-92f59e22bd8c

【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】

     大數(shù)據(jù)文摘二維碼

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2016-10-21 19:59:43

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)

2019-05-13 16:31:37

數(shù)據(jù)科學(xué)家專業(yè)人才職業(yè)

2013-04-11 10:03:55

2019-08-22 09:23:58

數(shù)據(jù)科學(xué)工程師數(shù)據(jù)處理

2018-11-05 17:33:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)

2018-03-12 12:44:59

數(shù)據(jù)科學(xué)家人工智能數(shù)據(jù)科學(xué)

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2018-12-20 12:09:03

Kaggle數(shù)據(jù)科學(xué)算法

2020-06-05 07:00:12

數(shù)據(jù)科學(xué)專業(yè)人員數(shù)據(jù)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2022-11-03 14:13:24

騰訊科學(xué)家

2009-04-01 09:23:29

IT工程師職場

2012-12-06 15:36:55

CIO

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2016-01-13 13:13:29

運維監(jiān)控工具

2020-06-15 09:32:59

程序員大公司小公司

2019-07-03 16:10:27

數(shù)據(jù)科學(xué)家數(shù)據(jù)庫數(shù)據(jù)工程師

2015-08-25 13:20:29

數(shù)據(jù)科學(xué)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 成人一级视频在线观看 | 天天色天天射天天干 | 中文字幕国产一区 | 国产91丝袜在线播放 | av片在线观看网站 | 欧美日韩高清免费 | 国产亚韩 | 欧美一区二区三区在线 | 色综合天天天天做夜夜夜夜做 | 成人免费网站在线 | 91精品国产乱码久久久久久 | 国产成人精品综合 | 中文字幕 国产精品 | 91在线视频免费观看 | 日韩在线一区二区 | 亚洲综合色视频在线观看 | 成人激情视频免费观看 | 三级视频在线观看电影 | 不卡一二区 | 国产欧美精品一区二区 | 操皮视频 | 国产午夜精品视频 | 可以免费看的毛片 | 少妇精品久久久久久久久久 | 亚洲视频中文字幕 | 欧美一区二区在线观看 | 色综合欧美 | 欧产日产国产精品视频 | 性福视频在线观看 | 成人a视频 | 欧日韩不卡在线视频 | 99久久久久| 99热首页| 超碰在线亚洲 | 国产精品永久免费视频 | 国产中文字幕av | 成人av电影在线 | 天天弄 | 国产精品久久久久久久久久久久久久 | 精品国产91亚洲一区二区三区www | 日日久 |