成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

既保護隱私又快速訓練,Facebook開源Opacus庫

新聞 開源
近日,Facebook 開源了一個新型庫 Opacus,它支持使用差分隱私來訓練 PyTorch 模型,擴展性優于目前的 SOTA 方法。

隱私保護是機器學習領域的重要倫理問題之一,而差分隱私(DP)是行之有效的隱私保護手段。那么,如何方便地使用差分隱私來訓練機器學習模型呢?近日,Facebook 開源了 Opacus 庫,支持以這種方式訓練 PyTorch 模型。

近日,Facebook 開源了一個新型庫 Opacus,它支持使用差分隱私來訓練 PyTorch 模型,擴展性優于目前的 SOTA 方法。同時,Opacus 庫支持以最少代碼更改來訓練模型,且不會影響訓練性能,并允許在線跟蹤任意給定時刻的隱私預算。

既保護隱私又快速訓練,Facebook開源Opacus庫

Opacus 庫開源地址:https://github.com/pytorch/opacus

Opacus 庫的目標受眾主要為以下兩類人群:

機器學習從業者:可以使用該庫輕松了解如何利用差分隱私訓練模型,該庫支持以最少代碼更改來訓練模型;

差分隱私科學家:Opacus 庫易于實驗和修復,這允許他們專注于更重要的事。

差分隱私是一個具備數學嚴謹性的框架,可用于量化敏感數據的匿名化。Facebook 在相關博客中表示,希望 Opacus 庫能為研究人員和工程師提供一條更簡單的途徑,以便在 ML 中使用差分隱私,并加快該領域的 DP 研究。

Opacus 庫提供了什么?

通過這個開源的高速庫 Opacus,你可以得到:

速度:利用 PyTorch 中的 Autograd hook,Opacus 能夠批量化計算每個樣本的梯度。與依賴 microbatching 的現有 DP 庫相比,Opacus 實現了一個數量級的加速。

安全性:Opacus 對其安全關鍵代碼使用密碼學安全偽隨機數生成器 CSPRNG,在 GPU 上對整批參數進行高速處理。

靈活性:基于 PyTorch,工程師和研究人員可以通過將 Opacus 代碼與 PyTorch 代碼和純 Python 代碼進行融合和匹配,快速為其 idea 構建原型。

生產效率:Opacus 庫附帶教程、在訓練開始前提示不兼容層的輔助函數,以及自動重構機制。

交互性:Opacus 可以追蹤用戶在任意給定時間所花費的隱私預算(DP 的核心數學概念),從而實現早停和實時監控。

Opacus 通過引入 PrivacyEngine abstraction 定義了一個輕量級的 API,它既可以追蹤隱私預算,也能夠處理模型梯度。該 API 無需直接調用,只需將其連接至標準 PyTorch 優化器。該 API 在后臺運行,這使得利用 Opacus 進行模型訓練變得非常簡單。用戶只需在訓練代碼開頭添加以下代碼即可:

訓練結束,即得到一個標準的 PyTorch 模型,并且它沒有部署私有模型的額外步驟或障礙:如果今天就想部署模型,你可以在使用 DP 訓練模型后進行部署,且無需更改一行代碼。

Opacus 庫還包括預訓練和微調模型、針對大型模型的教程,以及為隱私研究實驗而設計的基礎架構。

如何使用 Opacus 實現高速隱私訓練?

Opacus 旨在保留每個訓練樣本的隱私,同時盡量不影響最終模型的準確率。Opacus 通過修改標準 PyTorch 優化器來實現這一點,以便在訓練過程中實現(和度量)差分隱私。

具體來說,Opacus 的重點是差分隱私隨機梯度下降(DP-SGD)。該算法的核心思想是:通過干預模型用來更新權重的參數梯度來保護訓練集的隱私,而不是直接獲取數據。通過在每次迭代中向梯度添加噪聲,該庫可以防止模型記住訓練樣本,同時還可以實現在 aggregate 中的學習。在訓練過程的多個批次中,(無偏)噪聲自然會被抵消。

但是,添加噪聲需要一種微妙的平衡:噪聲過多會破壞信號,過少則無法保證隱私。為了確定合適的規模,我們需要查看梯度范數。限制每個樣本對梯度的影響非常重要,因為異常值的梯度大于大部分樣本。但是異常值的隱私也需要得到保護,因為它們極有可能被模型記住。

因此,開發者計算 minibatch 中每個樣本的梯度。開發者分別對每個梯度進行梯度裁剪,將其累積到一個梯度張量,然后再將噪聲添加其中。

基于每個樣本的計算是構建 Opacus 的最大障礙之一。PyTorch 的典型操作是利用 Autograd 計算整個批次的梯度張量,因為這對其他機器學習用例都有意義,并且可以優化性能。與之相比,基于每個樣本的計算顯然更具挑戰性。

為了克服這一困難,開發者利用 Ian Goodfellow 2015 年提出的高效技術(參見論文《EFFICIENT PER-EXAMPLE GRADIENT COMPUTATIONS》),獲取訓練標準神經網絡所需的全部梯度向量。

至于模型參數,則單獨返回給定批次中每個樣本的損失梯度,整個過程如下所示:

Opacus 工作流程圖,其中計算了每個樣本的梯度。

通過在運行各層時追蹤一些中間量,Opacus 庫支持使用適合內存的任何批量大小進行訓練。這使得該方法比其他替代性 micro-batch 方法快了一個數量級。

此外,Opacus 庫的安裝和使用過程也比較簡單,詳情參見 GitHub 項目。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2016-11-04 14:54:12

2021-12-29 13:41:23

安全個人信息虛擬號碼

2021-07-09 13:43:42

物聯網人工智能IoT

2022-04-26 15:40:43

物聯網安全5G

2018-04-26 11:01:40

數據

2010-08-26 14:03:23

隱私保護

2021-01-04 10:24:22

物聯網安全數據庫隱私保護

2023-01-12 23:11:17

Tiktok隱私數據安全

2024-02-04 17:03:30

2023-07-30 22:34:56

隱私保護檢索

2020-04-25 19:51:53

蘋果谷歌健康碼

2019-02-13 22:58:24

Facebook亞馬遜安全

2018-04-03 11:13:24

2013-10-23 11:18:11

2013-08-05 09:55:47

程序員

2010-11-01 09:25:00

2014-07-30 14:37:00

FacebookiOS開源庫

2011-08-19 15:15:04

2019-04-16 09:15:59

開源技術 趨勢

2024-03-18 08:00:00

人工智能安全
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕一区二区三区四区 | 欧美自拍另类 | 久久精品国产精品青草 | 成人片网址 | 91av在线影院 | 欧美影院| 日本三级在线网站 | 久国产| 丝袜一区二区三区 | 欧美日韩中文在线 | 久久久久久久久久久一区二区 | 成人一区二区视频 | 中文字幕亚洲一区二区va在线 | 国产精品久久久久久久久久久久 | 99热在线免费 | 精品日韩 | 欧美日韩成人影院 | 亚洲国产精品成人久久久 | 国产中文字幕在线观看 | 国产做a爱免费视频 | 日韩中文一区 | 青青久草 | 97色在线视频 | 欧美一区二区三区在线看 | 午夜看电影在线观看 | 欧美2区 | 91午夜在线 | 一区视频在线播放 | 日韩在线| 欧美在线视频网站 | 一区二区三区精品视频 | 精品成人69xx.xyz | 亚洲大片在线观看 | 亚洲 欧美 另类 综合 偷拍 | 精品福利一区二区三区 | 热久久性| 亚洲一二三区免费 | 国产精品久久久99 | 欧美日韩一区精品 | 日韩欧美第一页 | 99久久99久久精品国产片果冰 |