傳字節(jié)實習生刪除公司 GB 以下機器學習模型?網(wǎng)友:誰來背鍋?
昨天,在脈脈“我來爆個料”話題下,有人爆出「字節(jié)跳動一實習生刪除公司 GB 以下所有機器學習模型」。

一時間話題引起無數(shù)程序員圍觀。
lite模型指的是輕量級的模型,全稱TensorFlow Lite,是一種用于移動端設備深度學習的模型。例如分類,分割的相關模型都很小,很多非常有用的模型都屬于輕量模型。
輿論中,有人為實習生的「去留」擔憂:


也有人為該同學抱不平:

還有吃瓜群眾言,「在字節(jié)刪字節(jié),在頭條上頭條。」

那么言歸正傳,這個應該有誰來負責?事情的嚴重性又是幾何呢?
影響到底大不大?
該樓主評論表示,管理的給子目錄加了保護,但是實習生直接刪除的是hdfs,還加了 skip trash(刪除默認到trash,相當于windows的徹底刪除)。
不過有人表示,模型都是離線數(shù)據(jù),對線上影響不大。
還有人認為,「說明輕量模型確實沒前途了,大規(guī)模預訓練模型卷起來。」
據(jù)傳聞,還有傳言刪了以后,連事故處理群都加了三百多個人。更有員工為了修復加班到3點!
不過,吃瓜群眾最關心的莫過于「責任問題」。畢竟,一個實習生能夠刪除模型,ta的權限何來的呢?
有人爆料稱:該實習生實際上不是「手滑」,更不是「手抖」,而是多方問過才下次操作的……

更多的人認為:這鍋80%應該判給管理者!

還有人結合近期「字節(jié)大小周加班問題」調(diào)侃了一下:

權責問題引來討伐聲
問題引發(fā)了網(wǎng)友對權責問題的討論。
據(jù)知乎,事故的原因是實習生清理HDFS上的目錄,發(fā)現(xiàn)一個目錄最近更新時間是3月份,就以為這個不用了,多方求證之后得到了這個目錄已經(jīng)沒用的結果(絕了),然后刪掉了……
直到一個小時后有人發(fā)現(xiàn)模型上線不了……
在很多大公司,模型跑完后會放到Hadoop。

但實際上,權限管理目錄是個大學問,需要一套大流程。
有人提議,這種情況后續(xù)權限控制,或者把skip trash弄掉,或者盡可能把權限拆分到各自的模型上。
總之大部分網(wǎng)友認為,一個實習生不應該承擔太多的責任!
其實類似事情還有較為狗血的——2019年AI刪庫,程序員背鍋!
2019年,美國版大眾點評Yelp訓練了一個用來消除 bug 的神經(jīng)網(wǎng)絡,萬萬沒想到,該網(wǎng)絡刪除一切,從根本上徹底了實現(xiàn)“bug-free”.

最后,可憐的工程師背了鍋。
不小心刪庫是一種怎樣的體驗?
據(jù)說,程序員一生會刪三次庫。
在話題「不小心刪庫是一種怎樣的體驗?」下,很多人都發(fā)表了當年的經(jīng)歷。
比如這位答者:實習的時候刪過測試庫……

再比如:那感覺天塌下來一樣!

還有網(wǎng)友表示:「一輩子難忘!」
多年前(2001年),那還是unix字符界面,半夜我例行維護,我刪過一個包含二十萬本圖書的庫…………十分鐘后我確認我出錯后,我開始冒汗,胃部像是被猛打了一拳開始痙攣,疼的我都坐不住。
好一會我去過道抽了兩根煙,才回憶起前天做了全系統(tǒng)備份,丟的數(shù)據(jù)不多!
當然,惡意刪庫的現(xiàn)象也不在少數(shù)。
2020 年 2 月微盟員工惡意破壞公司數(shù)據(jù),讓微盟的市值一天之內(nèi)蒸發(fā)了超 10 億元。不久前,鏈家網(wǎng)一名員工惡意刪除了公司 9TB 數(shù)據(jù),造成公司財務系統(tǒng)服務器應用程序出現(xiàn)故障無法登錄。不過,這種嚴重的惡性事件,都讓他們受到了法律的審判。
不過,如果此次字節(jié)lite模型刪除真的沒影響線上,某種程度上,這還及時暴露了問題,甚至可能避免了以后更大的錯誤。