【RSA2019創(chuàng)新沙盒】Duality: 基于同態(tài)加密的數(shù)據(jù)分析和隱私保護方案
每屆RSA大會的創(chuàng)新沙盒環(huán)節(jié)都可謂萬眾矚目。創(chuàng)新沙盒的初衷是為網(wǎng)絡(luò)安全領(lǐng)域的初創(chuàng)企業(yè)提供平臺,讓他們展示自己的創(chuàng)新技術(shù)或愿景,以及他們可能為信息安全行業(yè)帶來的變革與發(fā)展。
2019年,入圍RSA大會創(chuàng)新沙盒“十強”的企業(yè)將在3月4日的大會現(xiàn)場各自進行3分鐘左右的展示并回答委員會的問題。評委包括行業(yè)投資專家、網(wǎng)絡(luò)安全專家、網(wǎng)絡(luò)安全公司的CEO、企業(yè)CISO、行業(yè)顧問等。為了幫助大家了解這十家企業(yè),綠盟科技推出了系列文章,今天為大介紹的的是Duality Technologies公司。
Duality Technologies成立于2016年,總部位于美國馬薩諸塞州劍橋市,由著名的密碼專家和數(shù)據(jù)科學(xué)家聯(lián)合創(chuàng)立。公司致力于研究大數(shù)據(jù)/云環(huán)境下的數(shù)據(jù)安全與隱私保護技術(shù),為企業(yè)組織提供了一個安全的數(shù)字協(xié)作平臺,目前在美國和以色列開展業(yè)務(wù)。目前獲得了由Team8領(lǐng)導(dǎo)的400萬美元投資。2019年入選RSA大會的創(chuàng)新沙盒前十強,成為兩家入選的數(shù)據(jù)安全公司之一(另一家是Wirewheel公司)。
1 背景介紹
在人工智能、大數(shù)據(jù)和云計算等信息產(chǎn)業(yè)蓬勃發(fā)展的同時,數(shù)據(jù)安全和敏感數(shù)據(jù)(包括個人隱私)泄露問題日益嚴(yán)峻。僅2018年過去的一年,就發(fā)生了多起重大的(千萬級記錄以上)數(shù)據(jù)泄露事件,如國外Facebook 8700萬用戶數(shù)據(jù)泄露,國內(nèi)圓通10億條用戶信息數(shù)據(jù)在暗網(wǎng)被出售,華住旗下多個連鎖酒店的2.4億入住記錄泄露。
數(shù)據(jù)泄露不僅造成公司形象受損、公信力降低,也直接或間接地導(dǎo)致公司經(jīng)濟的損失。隨著這些事件發(fā)生及影響的報道,企業(yè)對數(shù)據(jù)安全問題越來越重視,用戶的個人隱私保護意識也越來越強烈。同時,一些法律法規(guī)提出了更嚴(yán)格的數(shù)據(jù)安全與隱私保護要求。2018年5月25日,歐洲聯(lián)盟正式實施《通用數(shù)據(jù)保護條例》(General Data Protection Regulation,簡稱GDPR),對基本的個人身份信息、醫(yī)療敏感數(shù)據(jù)和網(wǎng)絡(luò)行為信息等提出安全保護要求。國內(nèi),相繼也頒布了類似的法律法規(guī),如《信息安全技術(shù)個人信息安全規(guī)范》、《信息安全技術(shù)大數(shù)據(jù)安全管理指南》和《信息安全技術(shù)個人信息去標(biāo)識化指南》等。
為了應(yīng)對數(shù)據(jù)安全與隱私保護挑戰(zhàn),企業(yè)除了應(yīng)用傳統(tǒng)的加解密技術(shù)外,還在根據(jù)不同的業(yè)務(wù)場景和需求,積極探索匿名化(Anonymity)、數(shù)據(jù)脫敏(Data Masking)和數(shù)字水印(Watermarking)等新型技術(shù),甚至一些前沿技術(shù)的實踐與落地,如保留格式加密(Format-Preserving Encryption,簡稱FPE)和差分隱私(Differential Privacy)等關(guān)鍵技術(shù)。然而,上述提到的幾種技術(shù)無法解決第三方平臺(如云環(huán)境)的數(shù)據(jù)處理過程的數(shù)據(jù)與隱私保護問題:① 傳統(tǒng)加密技術(shù)使得加密后數(shù)據(jù)失去可用性;② 脫敏等變換后的數(shù)據(jù)產(chǎn)生了失真,無法得到精確的處理結(jié)果。同態(tài)加密技術(shù)是近年來被學(xué)術(shù)界和工業(yè)界十分看好的一種加密技術(shù),可實現(xiàn)數(shù)據(jù)加密后仍然可以被處理。但是,現(xiàn)有的多數(shù)同態(tài)加密方案由于占用資源過大且速度過慢導(dǎo)致無法從理論實現(xiàn)實用化,目前仍然面臨各種問題與挑戰(zhàn)。
Duality Technologies公司結(jié)合自身在同態(tài)加密等先進密碼領(lǐng)域的研究和積累,聲稱突破了傳統(tǒng)實現(xiàn)的困難性,最終實現(xiàn)了商業(yè)化,提供數(shù)據(jù)分析和數(shù)據(jù)與隱私保護的數(shù)字協(xié)作平臺。接下來將對Duality公司、產(chǎn)品和關(guān)鍵技術(shù)進行一一解讀。
2 公司簡介
Duality公司強調(diào)“maximizing data utility, minimizing risk (最小化數(shù)據(jù)風(fēng)險的同時,最大化數(shù)據(jù)利用價值)”的理念,在大數(shù)據(jù)隱私保護、模型的版權(quán)保護和數(shù)據(jù)合規(guī)等方面為客戶提供實用的的解決方案。得益于自主研究的同態(tài)加密(Homomorphic Encryption)等先進密碼技術(shù),提供的安全產(chǎn)品可以使得數(shù)據(jù)在整個分析和處理生命周期中,始終保持加密狀態(tài),用戶無需解密即可生成數(shù)據(jù)洞察結(jié)果。比如在云計算場景中,數(shù)據(jù)擁有方將數(shù)據(jù)加密存儲在云計算平臺中,數(shù)據(jù)擁有方提交數(shù)據(jù)統(tǒng)計或處理任務(wù),直接對加密數(shù)據(jù)進行操作即可,不需要在云平臺中進行解密,因此存儲方無法獲取真實的數(shù)據(jù)內(nèi)容。Duality聲稱這項突破技術(shù)有利于企業(yè)內(nèi)部和企業(yè)間的數(shù)字協(xié)作,實現(xiàn)安全的機器學(xué)習(xí)和數(shù)據(jù)挖掘任務(wù),降低了數(shù)據(jù)泄露風(fēng)險,同時完全遵守隱私保護法規(guī)。
目前,Duality產(chǎn)品在醫(yī)療、金融、汽車、保險、電信和教育等多個領(lǐng)域有應(yīng)用。
3 公司產(chǎn)品
SecurePlus™平臺是Duality公司主打的產(chǎn)品。它允許數(shù)據(jù)的生命周期中,總是處于安全狀態(tài),敏感數(shù)據(jù)或有價值的模型不會暴露。SecurePlus™支持多方參與計算,有利于數(shù)字化的協(xié)作。SecurePlus™平臺主要有三種應(yīng)用場景:
(1) 安全數(shù)據(jù)分析
SecurePlus™平臺使得數(shù)據(jù)所有者在不公開敏感數(shù)據(jù)時(數(shù)據(jù)加密),仍然可以使用第三方分析工具,如機器學(xué)習(xí)、數(shù)據(jù)挖掘工具進行分析和處理。使用抗量子的同態(tài)加密技術(shù)實現(xiàn)了數(shù)據(jù)端到端的保護。SecurePlus™平臺保護了有價值的數(shù)據(jù)在不可信的云環(huán)境中的保密性和安全性。
(2) 機器學(xué)習(xí)模型的版權(quán)保護
該場景不同于前一個場景,即機器學(xué)習(xí)模型不屬于第三方,而是屬于客戶版權(quán)所有。SecurePlus™平臺確保模型擁有者將模型在不可信任的第三方部署、存儲和使用機器學(xué)習(xí)模型(一系列參數(shù))在云環(huán)境中一直處于加密狀態(tài),客戶端將樣本后加密后上傳至云端。通過同態(tài)加密運算,樣本和模型可以在密文域進行預(yù)測和分類任務(wù),完成后云端將結(jié)果返回給客戶端,客戶端將結(jié)果解密,得到真實的預(yù)測結(jié)果。由于沒有加解密密鑰一直保存在合法方,因此即使黑客和第三方即使竊取模型,也無法完成機器學(xué)習(xí)任務(wù)的閉環(huán)。
(3) 數(shù)據(jù)共享的隱私保護
SecurePlus™平臺確保多方數(shù)據(jù)安全共享與協(xié)作。同態(tài)加密在鏈接和計算過程中保護了每一方的資產(chǎn),在整個過程中保護隱私并且符合法律法規(guī)需求,特別是GDPR對于多方協(xié)同的數(shù)據(jù)隱私要求。
4 技術(shù)解讀
同態(tài)加密是Duality公司SecurePlus™產(chǎn)品的核心技術(shù)。同態(tài)加密是密碼學(xué)界近年來的一個研究熱點,主要應(yīng)用在不可信的云環(huán)境中。其加密函數(shù)具有以下性質(zhì),
該性質(zhì)稱為同態(tài)性。通俗地講,在密文域進行 操作相當(dāng)于在明文域進行 操作。這種性質(zhì)使得密文域的數(shù)據(jù)處理、分析或檢索等成為可能。即,不解密任何密文的條件下對仍然可以對相應(yīng)明文進行的運算,使得對加密信息仍能進行深入和無限的分析和處理。
同態(tài)加密的研究可以追溯到20世紀(jì)70年代,在RSA密碼體制剛提出不久,Rivest (RSA公鑰密碼設(shè)計者)等人又提出了全同態(tài)加密的概念,但一直沒有尋找到符合的全同態(tài)加密方案。直到2009年,IBM的研究人員Gentry首次設(shè)計出一個真正的全同態(tài)加密體制,隨后許多其他同態(tài)加密方案被提出。然而,多數(shù)方案由于占用資源過大且速度過慢導(dǎo)致方案無法實用化。根據(jù)該公司自身報道,其“同態(tài)加密”技術(shù)商用化和產(chǎn)品實現(xiàn)處在業(yè)界領(lǐng)先地位(由于無法獲得該產(chǎn)品的使用,無法真實地了解產(chǎn)品的性能如何,持質(zhì)疑和有待驗證態(tài)度),該技術(shù)在多個場景和實踐中有廣泛的應(yīng)用。
基于同態(tài)加密的機器學(xué)習(xí)是指在加密數(shù)據(jù)上實現(xiàn)機器學(xué)習(xí)任務(wù),如分類和聚類等,是近年來新的學(xué)術(shù)研究熱點。它可以分為加密神經(jīng)網(wǎng)絡(luò)、加密KNN、加密決策樹和加密支持向量機等算法。猜測Duality公司在方案實現(xiàn)上吸收和借鑒了這些已公開的研究成果。目前面臨一些問題與挑戰(zhàn)是[3]:
1. 如何在保證數(shù)據(jù)安全的前提下選擇合適的同態(tài)加密方案來實現(xiàn)不同的數(shù)據(jù)分析;
2. 如何解決全同態(tài)加密方案中存在的噪聲、運算復(fù)雜和運算效率低等問題;
3. 如何在確保算法安全性的前提下,使加密機器學(xué)習(xí)算法的準(zhǔn)確度在可接受范圍內(nèi)。
除了自身發(fā)展和產(chǎn)品化外,Duality公司在同態(tài)加密標(biāo)準(zhǔn)化工作中做出一些重要的貢獻。2016年6月,在第一次同態(tài)加密標(biāo)準(zhǔn)化研討會,與微軟、NIST等結(jié)果共同提出白皮書標(biāo)準(zhǔn):1) 安全同態(tài)加密的安全設(shè)置;2) 同態(tài)加密的API標(biāo)準(zhǔn);3) 同態(tài)加密的應(yīng)用。后續(xù),Duality公司主導(dǎo)并成立一個行業(yè)聯(lián)盟HomomorphicEncryption.org,定期召開后續(xù)會議來共同開發(fā)同態(tài)加密標(biāo)準(zhǔn)。該聯(lián)盟的參與者包括IBM和微軟等大型跨國公司、麻省理工學(xué)院(MIT)和斯坦福大學(xué)(Stanford)等領(lǐng)先學(xué)術(shù)機構(gòu)等領(lǐng)先初創(chuàng)企業(yè)。
5 總結(jié)
隨著云計算和大數(shù)據(jù)技術(shù)的發(fā)展,越來越多的數(shù)據(jù)在第三方平臺進行存儲和計算。在云端實現(xiàn)數(shù)據(jù)處理的同時,如何保證數(shù)據(jù)的安全性是客戶的一個普遍訴求。Duality公司的SecurePlus™平臺基于自主研發(fā)的同態(tài)加密先進技術(shù),提供了不一樣的解決思路。提供的三種實際業(yè)務(wù)場景,抓住了客戶的痛點,實現(xiàn)了“maximizing data utility, minimizing risk”,在第三方平臺進行機器學(xué)習(xí)和數(shù)據(jù)挖掘任務(wù)同時,可以保證數(shù)據(jù)不會被泄露。將同態(tài)加密技術(shù)率先實現(xiàn)商業(yè)化與落地、并成功應(yīng)用到數(shù)據(jù)安全領(lǐng)域中,是Duality公司在數(shù)據(jù)安全領(lǐng)域的差異化所在及創(chuàng)新亮點。最近,一個鼓舞人心的消息是,微軟開源了同態(tài)加密庫,并“堅信”該技術(shù)已成熟到可用在現(xiàn)實世界應(yīng)用的程度,源代碼已放至GitHub[4]。隨著GDPR法規(guī)的正式實施和RSA大會的宣傳,勢必該創(chuàng)新公司的同態(tài)加密解決方案將吸引大家強烈的關(guān)注與興趣。SecurePlus™平臺的成功案例將鼓舞其他安全公司重新評估該新型安全加密技術(shù),甚至加入未來幾年的重點投資選項。
參考鏈接
[1] https://duality.cloud/products/.
[2] http://homomorphicencryption.org/.
[3] 崔建京, 龍軍, 閔爾學(xué), 于洋, & 殷建平. (2018). 同態(tài)加密在加密機器學(xué)習(xí)中的應(yīng)用研究綜述. 計算機科學(xué), 45(4), 46-52.
[4] https://www.secrss.com/articles/767,讓專家和新手都輕松:微軟開源同態(tài)加密庫“SEAL”