PyTorch核心開發(fā)者靈魂發(fā)問:我們怎么越來越像Julia了?
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
PyTorch社區(qū)最近有一種聲音:下個版本應(yīng)該拋棄Python改用Julia語言。
現(xiàn)在就連PyTorch團隊內(nèi)部也會拿這個說法來開玩笑。
對這個問題,核心開發(fā)成員中的Edward Yang在論壇上作出過一些回應(yīng)。
他認為PyTorch的確越來越像Julia了,比如借鑒Julia的多重分派特性開發(fā)了Pytorch Dispatcher。
PyTorch總體的發(fā)展方向也和Julia的愿景一致,也就是同時具備拓展性、易用性和執(zhí)行性能。
一方面PyTorch的底層代碼后期用C++重寫以獲得更好的性能,另一方面functorch、fx等新功能又讓用戶可以直接使用Python做以前必須借助C++完成的工作。
那為什么不直接改用Julia呢?
害,其實是舍不得Python那無可替代的生態(tài)。
當初從原版Torch使用的Lua改用Python就是看中了生態(tài)這一點。這么多年過去了其他語言生態(tài)連一點可能超過Python的跡象都沒有。
簡而言之,Julia語言本身的特性和Python的生態(tài)他們全都要,向Julia的優(yōu)點學(xué)習也是團隊未來的努力方向。
那么,Julia這種語言到底好在哪,讓PyTorch開發(fā)團隊都向它學(xué)習?
面向科學(xué)計算設(shè)計的語言
Julia來自麻省理工CSAIL實驗室,設(shè)計初衷就是想要一個既有C的速度又有Ruby的動態(tài)性、既能像Matlab一樣使用數(shù)學(xué)表達式又有Python的通用性。
Julia要能像Perl一樣自然地處理字符串、像R一樣適用于統(tǒng)計,像Shell一樣作為膠水語言去和其他語言交互。
要有Hadoop的并行計算能力,又不想要那些繁雜的配置。
最后做出來的Julia采用即時編譯(Just In Time),速度比需要解釋器的Python快得多,又沒有失去交互性。
通過多重分派(Multiple Dispatch)特性來實現(xiàn)類型穩(wěn)定又不時腳本語言的簡潔靈活。
同一個函數(shù)名對不同參數(shù)類型的調(diào)用分派不同的操作,因為適合處理多種數(shù)據(jù)類型還被PyTorch給學(xué)了去。

具體到機器學(xué)習來說,Julia執(zhí)行各類算法包括矩陣運算的速度都比Python快得多。

Julia生態(tài)里也有自己的開源深度學(xué)習框架Julia Flux。

此外Julia還在語法上對線性代數(shù)、數(shù)據(jù)處理這些場景有額外的優(yōu)化。
比如支持Unicode數(shù)學(xué)符號,數(shù)字乘以變量時候可以省略「*」,以及索引從1而不是0開始更符合人類直覺….
Julia代碼可以寫成這樣:
- α = 0.5
- ∇f(u) = α*u; ∇f(2)
- sin(2π)
以至于有些數(shù)學(xué)背景的開發(fā)者認為,Julia代碼寫起來就像在黑板上做數(shù)學(xué)題一樣的,很親切。

相比之下,用Python做矩陣運算感覺就……不是那么好。
Python:
- np.dot(array1,array2)
Julia:
- array1 .* array2
Julia的歷史可以追溯到2009年,由于想實現(xiàn)的功能太多,直到2018年才對外發(fā)布1.0正式版。
不過最近幾年Julia已迅速被金融、醫(yī)藥、航天等一些行業(yè)接受,使用者包括摩根大通、輝瑞、NASA等。
△ TIOBE指數(shù)中的Julia流行趨勢變化
Julia改變了過去他們只能用C等高性能語言做底層開發(fā)、同時用高易用性的Python等語言做擴展開發(fā)的割裂問題。
今年7月,Julia創(chuàng)始團隊成立的公司Julia Computing還獲得2400萬美元的A輪融資。
Julia語言速度快、天生適合機器學(xué)習又在高速成長,也難怪PyTorch社區(qū)會有用Julia替代Python的聲音出現(xiàn)。
有人認為Python是一種糟糕的語言,雖然有優(yōu)秀的生態(tài),但生態(tài)中對機器學(xué)習最有價值的部分(Numpy)其實是用C實現(xiàn)的。

Python生態(tài)雖然強大,但人們對其中的混亂也有不少詬病,各種重復(fù)開發(fā)的包管理系統(tǒng)讓配置好Python開發(fā)環(huán)境都不是一件容易事。

相比之下,Julia的包管理方案就很統(tǒng)一,雖然有可能是還在起步階段沒來得及混亂。
也有人認為Python這些所謂的缺點其實正是它流行的原因。
像Python、Javascript和PHP這種看起來糟糕的語言,正是因為能夠輕松的編寫糟糕代碼,降低了門檻而流行。

這位要提醒大家Julia自身就帶有和其他語言的交互功能,他平常會在Julia代碼里調(diào)用Huggingface的Python模型作開發(fā),兩種生態(tài)都用上才是墜吼的。

最后,有人很不理解PyTorch開發(fā)團隊不選擇遷移到Julia的做法,既然Julia語言有所有他們需要的特性,還要花時間在Python里重新造輪子是自找麻煩。

另一位的視角有些微妙的不同:
這正是PyTorch團隊想把方便留給用戶,而把麻煩留給自己。對這種態(tài)度我很感激。