每種編程語言的平均收入
幾周前我提到過如何通過使用git的提交元數據(metadata)和Rapleaf API 來收集Github上熱門組織的一些統計資料(日志, 每個組織的數據)。現在我又對這些數據按編程語言而不是組織進行劃分產生了興趣。網上關于各編程語言對應的屌絲程序員的描述比比皆是,但我還是很好奇它們 是如何與現實中的人們對應起來的。
幾周前我提到過如何通過使用git的提交元數據(metadata)和Rapleaf API 來收集Github上熱門組織的一些統計資料(日志, 每個組織的數據)。
現 在我又對這些數據按編程語言而不是組織進行劃分產生了興趣。網上關于各編程語言對應的屌絲程序員的描述比比皆是,但我還是很好奇它們是如何與現實中的人們 對應起來的。一開始,我想先簡單地統計一下每種編程語言使用者的年齡、收入和性別。基于我已經收集的數據,這一工作還是比較輕松的:
- 對于統計每個repo使用的編程語言,我使用Github自帶的語言統計結果。例如,Github估計這個項目中75%是java代碼。
- 統計了每個項目中某種語言代碼占用大于50%的那些貢獻者的收入
- 過濾出那些收入點>100的編程語言
下面是收入的統計結果,升序排列:
Language | Average Household Income ($) | Data Points |
Puppet | 87,589.29 | 112 |
Haskell | 89,973.82 | 191 |
PHP | 94,031.19 | 978 |
CoffeeScript | 94,890.80 | 435 |
VimL | 94,967.11 | 532 |
Shell | 96,930.54 | 979 |
Lua | 96,930.69 | 101 |
Erlang | 97,306.55 | 168 |
Clojure | 97,500.00 | 269 |
Python | 97,578.87 | 2314 |
JavaScript | 97,598.75 | 3443 |
Emacs Lisp | 97,774.65 | 355 |
C# | 97,823.31 | 665 |
Ruby | 98,238.74 | 3242 |
C++ | 99,147.93 | 845 |
CSS | 99,881.40 | 527 |
Perl | 100,295.45 | 990 |
C | 100,766.51 | 2120 |
Go | 101,158.01 | 231 |
Scala | 101,460.91 | 243 |
ColdFusion | 101,536.70 | 109 |
Objective-C | 101,801.60 | 562 |
Groovy | 102,650.86 | 116 |
Java | 103,179.39 | 1402 |
XSLT | 106,199.19 | 123 |
ActionScript | 108,119.47 | 113 |
這是上表對應的柱狀圖:
對于大多數語言的排名還是比較符合預期的,得出了一下結論:
- Haskell是一種非常學術化的(academic)語言,因此學術界不會以薪資而聞名。
- PHP是一種非常通用的語言,普通的、年輕的、低收入的程序員都可以上手。
- 從圖譜右側***的部分可看出,Java和ActionScript多用于企業級軟件的開發,因此其薪資待遇是相當的可觀。
另一方面,由于對某些語言,像XSLT, Puppet, CoffeeScript不太熟悉,大家知道為什么這些語言排名較高或收入較低嗎?感謝告知。
需要說明的是:
- 所有這些數據都來自開源項目,因而可能無法精確地體現那些閉源開發者們的收入水平。
- Rapleaf并沒有完全統計所有人的收入,因此數據可能存在偏差。
- 數據(年齡、性別……)有誤差
- 沒有對Github上所有項目進行統計,因此結論可能不具有代表性。
***,對統計結果或方法有任何想法或建議請告知我,我還會再出一份按年齡、性別排名的編程語言報告。