軟件自由保護協會拒絕Github!代碼“借用”界限何在?
譯文作者丨Tristan Greene
譯者 | 布加迪
審校丨Noe
軟件自由保護協會(SFC)是一家由廣大開源倡導者組成的非營利性社區,近日在一篇措辭嚴厲的博文中宣布退出GitHub,還敦促成員和支持者強烈譴責該平臺。
起因:SFC與GitHub鬧得不愉快源于前者指責:微軟和OpenAI用根據開源許可證發布的數據來訓練Copilot這個人工智能系統。
開源代碼可不像捐款箱:你想取多少就完全可以取多少,并以你選擇的任何方式使用它。開源代碼更像是照片。雖然攝影師并不對你就使用其某張照片收取費用,但你依然需要注明出處,在道德上和法律上向對方表示應有的感謝。
據SFC網站上的一篇博文聲稱,Copilot在使用別人的代碼片段時根本沒有這么做:
這讓人不由得想起了GitHub長期存在的問題,以及我們必須共同拋棄GitHub的主要原因。我們已經從Copilot、GitHub的核心托管服務以及它努力開展的幾乎所有工作看到,GitHub的行為比同行惡劣得多。我們不認為亞馬遜、Atlassian、GitLab或其他任何營利性托管服務商的做法堪稱完美。然而,如果將GitHub的行為與這些同行的行為作一番比較,就會發現GitHub的行為要糟糕得多。
背景:GitHub是全世界事實上的開源代碼存儲庫。它好比YouTube、Twitter和Reddit的結合體,只是面向的群體是程序員及他們編寫的代碼。
當然,外面有其他選擇。但是從一個代碼存儲庫生態系統換成另一個生態系統與將Instagram換成TikTok并不是一回事。
微軟在2018年斥資逾70億美元收購了GitHub。從那以后,微軟利用其作為OpenAI主要贊助商的地位,共同致力于開發Copilot。
要訪問及使用Copilot,唯一的方法是通過微軟的特別邀請或付費訂閱。
SFC及其他開源倡導者之所以深感不安,是由于微軟和OpenAI本質上使用別人的代碼大發其財,還剝奪了那些使用代碼的人給予應有感謝的能力。換句話說:微軟在剽竊人們的勞動成果,剝奪他人的功勞,并通過算法將其出售給他人。
解決辦法:殺死Copilot。或者,微軟和OpenAI不妨打造一臺時間機器,回到過去,標記Copilot數據庫中的每一個數據點,以便可以構建第二個版本的模型,對他人編寫的每行代碼給予應有的感謝。
但是面對你可以隨心所欲的監管環境,利用他人的勞動成果總是比關心自己提供的產品和服務符合倫理道德要來得容易。
說到人工智能讓人類生活更輕松的具體實例,GitHub的Copilot首當其沖。一些單調乏味的工作可能需要開發人員花數小時來處理,Copilot卻可以使它們變得就像摁按鈕或輸入幾行文本一樣簡單。
這方面有幾個先例。GPT-3和Dall-E使用人類生成的媒體的數據庫來生成新的輸出。
但是這些生成器與Copilot有一個關鍵的區別。以大畫家莫奈的風格畫一只鴨子或者讓GPT-3給你講一則關于快樂狗的故事是一回事。從數據庫中的文件原封不動地逐行重復代碼片段,不是按照別人的風格編寫代碼,而是公然盜用別人的代碼。
有時可能比這來得還要微妙。當然,有時解決代碼編寫問題的方法不止一種。編寫代碼常常既是一門科學,又是一門藝術。
然而就因為你可以用iPhone拍下落日的照片,并不意味著就可以盜用別人的日落照片,聲稱這是自己拍的照片,然后賣給別人。
到頭來,這并不重要。Copilot大受歡迎。開發社區似乎絕對喜歡它。它在輿論界得到的褒獎遠比批評多得多。
暫且不說它最終會對開源社區產生什么影響。如果你完全在無償工作,結果只是為微軟賺錢,誰需要開源存儲庫?
關鍵是,你還別無選擇。沒有選擇加入或選擇退出一說。微軟和OpenAI擁有你的數據,沒有什么能阻止它們用你的數據做它們想做的任何事情。抵抗是徒勞無益的。
原文標題:Copilot works so well because it steals open source code and strips credit
鏈接:https://thenextweb.com/news/github-copilot-works-so-well-because-it-steals-open-source-code-strips-credit