成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

PyTorch 1.8發布,支持AMD GPU和Python函數轉換

開發 開發工具 前端
近日,PyTorch 團隊發布了 PyTorch 1.8 版本。該版本整合了自去年 10 月 1.7 版本發布以來的 3000 多次 commit,提供了編譯、代碼優化、科學計算前端 API 方面的主要更新和新特性。

近日,PyTorch 團隊發布了 PyTorch 1.8 版本。該版本整合了自去年 10 月 1.7 版本發布以來的 3000 多次 commit,提供了編譯、代碼優化、科學計算前端 API 方面的主要更新和新特性。值得一提的是,該版本新增了對 AMD ROCm 的支持。

此外,PyTorch 1.8 版本還為大規模訓練 pipeline 和模型并行化、梯度壓縮提供了特性改進。該版本的主要亮點如下:

  • 支持 Python 函數轉換;
  • 添加或穩定化 API,以支持 FFT (torch.fft)、線性代數函數 (torch.linalg);
  • 添加對復雜張量 autograd 的支持;
  • 多項更新用于提升 Hessian 與 Jacobian 矩陣計算的性能;
  • 改進分布式訓練,包括提升 NCCL 可靠性、支持 pipeline 并行化、RPC profiling,以及通過添加梯度壓縮來支持通信鉤子(hook)。

(注:從 PyTorch 1.6 版本開始,PyTorch 特性分為 Stable(穩定版)、Beta(測試版)和 Prototype(原型版)。

此外,PyTorch 團隊還對多個 PyTorch 庫進行了主要更新,包括 TorchCSPRNG、TorchVision、TorchText 和 TorchAudio。

新增和更新 API

(1) 通過 torch.fft 支持 NumPy 兼容的 FFT 操作

PyTorch 1.7 版本提出了這一特性的 Beta 版,而在 1.8 版本中該特性更新為穩定版。FFT 支持旨在完成 PyTorch 支持科學計算的目的。torch.fft 模塊和 NumPy 的 np.fft 模塊實現了同樣的功能,并且支持硬件加速和 autograd。

(2) 通過 torch.linalg 支持 NumPy 式的線性代數函數

torch.linalg 模塊類似于 NumPy 中的 np.linalg 模塊,支持 NumPy 式的線性代數操作,包括 Cholesky 分解、行列式、特征值等。

使用 torch.fx 進行 Python 代碼轉換

這一 Beta 特性支持 Python 代碼轉換,開發者可以利用它做 Conv/BN 融合、圖模式量化、實現 vmap 等。鑒于 torch.fx 提供 PyTorch 代碼的圖表示,開發者可以用 Python 寫任意變換或分析。

分布式訓練

(1) pipeline 并行化

這一新增的 Beta 特性提供了一個易用的 PyTorch API,可將 pipeline 并行化作為訓練 loop 的一部分。

(2) DDP 通信鉤子

DDP 通信鉤子是一個通用接口,用于控制 workers 間的梯度通信。

此外,PyTorch 1.8 還增加了一些 prototype 特性:

  • ZeroRedundancyOptimizer:有助于減少每個線程的內存占用;
  • Process Group NCCL Send/Recv:該特性允許用戶在 Python 層(而非 C++ 層)實現集合操作;
  • CUDA-support in RPC using TensorPipe:該特性為使用 PyTorch RPC 和多 GPU 機器的用戶帶來速度提升;
  • Remote Module:該特性允許用戶像操作本地模塊那樣操作遠程 worker 上的模塊。

支持 PyTorch Mobile

此次版本更新發布了一組新的移動端教程,包括在 iOS 端和安卓端實現圖像分割 DeepLabV3 模型。PyTorch 還發布了新的 demo app,包括圖像分割、目標檢測、神經機器翻譯、問答和視覺 transformer。

此外,這次發布還包括 PyTorch Mobile Lite Interpreter,該解釋器可降低運行時二進制文件大小。

性能優化

為了幫助用戶更好地監控性能變化,PyTorch 1.8 版本支持 benchmark utils,并開放了新的自動量化 API——FX Graph Mode Quantization。

硬件支持

在硬件支持方面,PyTorch 1.8 版本新增了兩個 Beta 特性:

  • 擴展 PyTorch Dispatcher,使之適應新型 C++ 后端;支持 AMD ROCm。
  • 需要注意的是,PyTorch 1.8 僅在 Linux 系統中支持 AMD ROCm。

參考鏈接:

  • https://pytorch.org/blog/pytorch-1.8-released/
  • https://github.com/pytorch/pytorch
  • https://pytorch.org/
  • https://twitter.com/cHHillee/status/1367621538791317504

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】 

戳這里,看該作者更多好文

 

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2016-12-06 17:25:47

Mevoco

2012-02-13 15:29:32

Python

2012-06-25 14:04:19

2021-03-05 15:50:25

開發技能代碼

2022-07-03 14:07:04

PyTorchMac

2012-04-11 10:10:35

JavaJFormDesign

2011-09-29 10:11:37

EclipseJava

2020-10-30 09:04:44

PyTorch 1.7分布式訓練API

2013-05-13 09:59:31

ruby

2010-07-01 09:25:18

Lift 2.0Web應用框架Scala Lift

2011-08-10 09:53:32

Python

2012-02-06 09:21:26

JavaCommons Con

2009-10-20 11:03:18

Spring 3.0

2012-03-16 10:02:28

ZK StudioJavaEclipse

2009-12-17 08:54:31

MySQL 5.5半同步復制

2009-03-04 15:16:55

C#SharpDevelo.net

2010-07-27 13:56:55

Ubuntu TweaUbuntu 10.1

2010-06-24 09:35:12

AMD皓龍4100

2018-09-21 15:05:24

顯卡識別工具

2011-03-18 08:51:23

MongoDB分布式文檔
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精久久久久久久妇剪断 | 国产伦一区二区三区四区 | 国产成人精品在线 | 欧美专区日韩专区 | 久久精品天堂 | 精品国产伦一区二区三区观看体验 | 亚洲毛片在线观看 | 亚洲综合视频 | 亚洲成人综合社区 | 日韩欧美中文字幕在线观看 | 日韩在线精品视频 | 中文字幕免费 | 国产精品毛片无码 | 丝袜一区二区三区 | 日日操夜夜操天天操 | 婷婷91 | 亚洲精品乱码8久久久久久日本 | 免费的网站www | 欧美日韩午夜精品 | 天天干天天色 | 亚洲看片网站 | 免费精品 | av喷水 | 欧美国产精品 | 国产不卡视频在线 | 99精品国产一区二区三区 | 久久九七| 污污的网站在线观看 | 国产成人久久精品一区二区三区 | 色吧色综合 | 欧美日批 | 中文字幕中文字幕 | 久久久成人精品 | 91就要激情 | 三级在线视频 | 欧美日韩在线播放 | 噜久寡妇噜噜久久寡妇 | 一区二区三区高清 | 国产福利资源 | 国产一区二区视频免费在线观看 | 欧美mv日韩mv国产网站91进入 |