新版TensorFlow又立flag!官方團隊明確「四大支柱」:承諾100%向后兼容,2023年發布
在TensorFlow和PyTorch之間,你選擇誰?
煉丹師們想必都被TF折磨過,靜態圖、依賴問題、莫名其妙的改接口,即便是谷歌發布了TF 2.0之后依然沒有解決問題。在萬般無奈下轉投PyTorch后,世界都變晴了。
「人生苦短,我用PyTorch」
甚至從谷歌開始著手宣發新一代計算框架JAX來看,似乎官方都對TF有點放棄的意思了,TensorFlow距離墳墓只有半步之遙。
趕在TF七歲生日之前,TensorFlow的開發團隊發布了一個博客,宣布TensorFlow將會繼續開發,并且將會在2023年發布全新版本,對接口的臟、亂、差情況進行整改,并承諾100%向后兼容!
TensorFlow戰未來
大約七年前,也就是2015年11月9日,TensorFlow正式開源。
也是從那時起,成千上萬的開源貢獻者和社區內的谷歌開發專家、社區組織者、研究人員和全球教育家都投入到TensorFlow的開發上。
七年后的今天,TensorFlow已然是最常用的機器學習平臺,數以百萬計的開發人員都在用。
TF是gitHub上排名第三的軟件資源庫(僅次于 Vue 和 React) ,也是 PyPI 上下載次數最多的機器學習軟件包。
TF還將機器學習帶入了移動生態系統: TFLite運行在40億臺設備。
TensorFlow 也把機器學習帶到了瀏覽器中: TensorFlow.js的下載次數為每周17萬次。
在谷歌的產品系列中,TensorFlow 幾乎為所有的生產機器學習提供支持,包括搜索、 GMail、 YouTube、地圖、Play、廣告、照片等等。
除了谷歌以外,在Alphabet旗下的其他子公司中,TensorFlow和Keras也為Waymo的自動駕駛汽車提供了機器智能的基礎。
在更廣泛的行業中,TensorFlow 為數千家公司的機器學習系統提供動力,其中包括世界上大多數最大的機器學習用戶——蘋果、字節跳動、 Netflix、騰訊、 Twitter 等等。
在研究領域,每個月,Google Scholar都會收錄超過3000篇新的科學文獻中提到TensorFlow或Keras
TF走到今天,其用戶基礎和開發者生態系統比以往任何時候都更大,并且還在不斷增長!
TensorFlow 的發展不僅是一個值得慶祝的成就,而且是一個機會,可以進一步為機器學習社區提供更多的價值。
開發團隊的目標是提供地球上最好的機器學習平臺,并努力將機器學習從一個小眾行業轉變為像Web開發一樣成熟的產業。
為了實現這一目標,開發團隊愿意傾聽用戶的需求,預測新的行業趨勢,迭代軟件的接口,并努力使大規模創新變得越來越容易。
機器學習正在迅速發展,TensorFlow 也是如此。
開發團隊已經開始研究 TensorFlow 的下一個迭代版本,將支持下一個十年的機器學習開發,一起戰未來!
TensorFlow的四大支柱
快速且可擴展:XLA 編譯、分布式計算、性能優化
TF將專注于 XLA 的編譯,在TPU性能優勢的基礎上,使大多數模型的訓練和推理工作流程在 GPU 和 CPU 上更快。開發團隊希望XLA成為深度學習編譯器的行業標準,并且作為 OpenXLA 計劃的一部分,目前已開源。
同時團隊也開始研究可用于大規模模型并行的新接口DTensor,可能會開啟超大型模型訓練和部署的未來。用戶開發大模型時,即便同時使用多個客戶端,感知上也像在單機上訓練一樣。
DTensor將會與tf.distribution的接口進行統一,支持靈活的模型和數據并行。
開發團隊還將進一步研究算法性能優化技術,如混合精度和降低精度的計算,可以提供相當大的GPU和TPU的速度提升。
應用機器學習
為計算機視覺和自然語言處理領域提供新工具。
團隊正在研究的應用機器學習生態系統,特別是通過 KerasCV 和 KerasNLP 軟件包為應用CV和NLP用例提供模塊化和可組合的組件,包括大量最先進的預訓練模型。
對于開發者來說,團隊也將為流行的和新興的應用機器學習用例添加更多的代碼示例、指南和文檔,最終目標是逐步減少機器學習的行業壁壘,并將其轉變為每個開發人員手中的工具。
更容易部署
開發者將會容易導出模型,比如導出到移動設備(Android 或 iOS)、邊緣設備(微控制器)、服務器后端或JavaScript會變得更加簡單。
未來,將模型導出到 TFLite 和 TF.js 并優化其推理性能就像調用mod.export ()一樣簡單。
同時,團隊也在開發用于本機服務端推理的公共TF2 C++接口,可以直接作為C++程序的一部分。
不管你是用JAX和TensorFlow Serving開發的模型,還是使用 TensorFlow Lite 和 TensorFlow.js 開發的移動和 Web 模型,都將會變得更容易部署。
更簡單
隨著機器學習領域在過去幾年的擴張,TensorFlow的接口也越來越多,而且并不總是以一致或簡單易懂的方式呈現。
開發團隊正在積極地整合和簡化這些 API,比如對數字采用 NumPy API 標準等。
模型的調試也是一個需要考慮的問題,優秀的框架不僅僅是它的API接口設計,也包括調試體驗。
團隊的目標是通過更好的調試能力,最大限度地縮短開發任何應用機器學習系統的解決時間。
承諾:100%向后兼容
開發團隊希望 TensorFlow 成為機器學習行業的基石,所以API的穩定性也是最重要的特性。
作為一個依賴 TensorFlow 作為產品一部分的工程師,作為一個 TensorFlow 生態系統包的構建者,你可以升級到最新的TensorFlow 版本,并立即享受新功能和性能所帶來的改進,而無需擔心現有的代碼庫可能會崩潰。
因此,開發團隊承諾從TensorFlow 2到下一個版本完全向后兼容性。
TensorFlow 2代碼可以按原樣運行,無需進行代碼轉換,也不需要進行手動更改。
團隊計劃在2023年第二季度發布 TensorFlow 新功能的預覽版,并將在今年晚些時候發布產品版本。