數(shù)據(jù)安全共享和價(jià)值轉(zhuǎn)化既是政策導(dǎo)向,也是大數(shù)據(jù)和數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵。隱私計(jì)算技術(shù),已成為數(shù)據(jù)流通安全的“最 優(yōu)技術(shù)解”。
政策法規(guī)加速落地,市場(chǎng)關(guān)注度快速提升。我國(guó)多部與數(shù)據(jù)安全相關(guān)的法律法規(guī)落地實(shí)施,形成了較為完備的安全法律體系,多部法規(guī)與政策明確鼓勵(lì)運(yùn)用隱私計(jì)算技術(shù)破局?jǐn)?shù)據(jù)流通中的安全問題,使得隱私計(jì)算成為當(dāng)下火熱的新興技術(shù)。
本文以隱私計(jì)算多種技術(shù)與未來發(fā)展為核心,帶你一文快速讀懂隱私計(jì)算多種技術(shù)路線,并對(duì)技術(shù)流變發(fā)展趨勢(shì)做出預(yù)測(cè)。
崛起 70 年:主流技術(shù)路線速覽
隱私計(jì)算是在保護(hù)數(shù)據(jù)本身不對(duì)外泄露的前提下,實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的一系列技術(shù)路線的統(tǒng)稱,可達(dá)到“數(shù)據(jù)可用不可見”的目的,在充分保護(hù)數(shù)據(jù)和隱私安全的前提下,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的轉(zhuǎn)化和釋放。
隱私計(jì)算并非單一的技術(shù),而是包含多種隱私保護(hù)技術(shù)、隱私增強(qiáng)技術(shù),是一系列技術(shù)的統(tǒng)稱,涉及密碼學(xué)、安全硬件、信息論、分布式計(jì)算等多個(gè)學(xué)科?!半[私計(jì)算”這個(gè)概念雖然誕生時(shí)間不長(zhǎng),但從其現(xiàn)代密碼學(xué)的本質(zhì)來看,其相關(guān)技術(shù)理論的研究有著相當(dāng)?shù)囊欢螝v史。
從 1949 年香農(nóng)開創(chuàng)現(xiàn)代密碼學(xué)時(shí)代起,安全多方計(jì)算、零知識(shí)證明被陸續(xù)提出,多種新的技術(shù)路線和隱私計(jì)算方案(例如混淆電路、基于秘密分享的MPC、半同態(tài)加密等協(xié)議和算法等)也陸續(xù)出現(xiàn)。七十余年間,隱私計(jì)算經(jīng)歷多個(gè)里程碑,技術(shù)體系逐步發(fā)展和壯大,并開始有大規(guī)模的項(xiàng)目落地。
2019 年后,隱私計(jì)算進(jìn)入應(yīng)用期,走出學(xué)院派與實(shí)驗(yàn)室,廣泛與行業(yè)應(yīng)用場(chǎng)景相結(jié)合。各類隱私計(jì)算廠商也如雨后春筍一般涌現(xiàn)出來,激發(fā)了隱私計(jì)算技術(shù)可用性的快速提升。
當(dāng)前,隱私計(jì)算在應(yīng)用中快速發(fā)展,領(lǐng)域內(nèi)仍在持續(xù)涌現(xiàn)出更多新的技術(shù)特點(diǎn)和解決方案。
從技術(shù)層面來說,隱私計(jì)算主要有三類主流技術(shù)路線:一類是采用密碼學(xué)和分布式系統(tǒng),以多方安全計(jì)算(Secure Multiparty Compute,MPC)為代表;另一類是采用基于硬件的可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE);最后一類是近年來發(fā)展相當(dāng)火熱的聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)。此外,還有零知識(shí)證明、同態(tài)加密、差分隱私等技術(shù)。各類技術(shù)路線融合應(yīng)用趨勢(shì)凸顯。
多方安全計(jì)算
多方安全計(jì)算(Secure Multiparty Compute,MPC)是一種將計(jì)算分布在多個(gè)參與方之間的密碼學(xué)分支,參與者在不泄露各自隱私數(shù)據(jù)情況下,利用隱私數(shù)據(jù)參與保密計(jì)算,共同完成某項(xiàng)計(jì)算任務(wù)。
這項(xiàng)技術(shù)最早可追溯至 1981 年,Rabin首 次提出通過Oblivious Transfer(OT) 協(xié)議實(shí)現(xiàn)機(jī)密信息交互。 1982 年,姚期智教授在論文《Protocols for Secure Computations》中提出“百萬富翁問題“,即兩個(gè)百萬富翁在沒有可信第三方、不透露自己財(cái)產(chǎn)狀況的情況下,如何比較誰更富有,這標(biāo)志著多方安全計(jì)算技術(shù)的產(chǎn)生。 1986 年,姚期智教授提出混淆電路技術(shù),實(shí)現(xiàn)了第 一個(gè)多方(兩方)安全計(jì)算方案。 1987 年,Goldreich等人提出了基于電路的秘密共享方案GMW,并將其應(yīng)用于多方安全計(jì)算。
同態(tài)加密
同態(tài)加密(Homomorphic Encryption,HE)是一種通過對(duì)相關(guān)密文進(jìn)行有效操作(不需獲知解密秘鑰),從而允許在加密內(nèi)容上進(jìn)行特定代數(shù)運(yùn)算的加密方法。其特點(diǎn)是允許在加密之后的密文上直接進(jìn)行計(jì)算,且計(jì)算結(jié)果解密后和明文的計(jì)算結(jié)果一致。
1978 年,Ron Rivest、Leonard Adleman和Michael L. Dertouzos提出同態(tài)加密問題,并在同年提出滿足乘法同態(tài)的RSA算法。同態(tài)加密問題的提出將加密技術(shù)的研究從靜態(tài)引向動(dòng)態(tài),是理論上的巨大革新,也開創(chuàng)了隱私計(jì)算的先河。 2009 年,Gentry提出了首 個(gè)實(shí)用的全同態(tài)加密算法,標(biāo)志著全同態(tài)計(jì)算時(shí)代的開始。 2017 年,國(guó)際同態(tài)加密標(biāo)準(zhǔn)委員會(huì)成立,標(biāo)志著同態(tài)加密在全球進(jìn)入高速發(fā)展階段。
聯(lián)邦學(xué)習(xí)
聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)是一種具有隱私保護(hù)屬性的分布式機(jī)器學(xué)習(xí)技術(shù)。在機(jī)器學(xué)習(xí)中,通常會(huì)從多個(gè)數(shù)據(jù)源聚合訓(xùn)練數(shù)據(jù),并將其傳送到中央服務(wù)器進(jìn)行訓(xùn)練。然而這一過程容易產(chǎn)生數(shù)據(jù)泄露風(fēng)險(xiǎn)。在聯(lián)邦學(xué)習(xí)模型中,運(yùn)算在本地進(jìn)行,只在各個(gè)參與方之間交換不包含隱私信息的中間運(yùn)算結(jié)果,用于優(yōu)化各個(gè)參與方相關(guān)的模型參數(shù),最終產(chǎn)生聯(lián)邦模型,并將應(yīng)用于推理,從而實(shí)現(xiàn)了“原始數(shù)據(jù)不出本地”、“數(shù)據(jù)可用不可見”的數(shù)據(jù)應(yīng)用模式。按照數(shù)據(jù)集合維度相似性構(gòu)成的特點(diǎn),業(yè)界普遍將聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)與聯(lián)邦遷移學(xué)習(xí)。
2012 年,王爽等在期刊Journal?of?Biomedical?Informatics發(fā)表論文,首 次解決醫(yī)療在線安全聯(lián)邦學(xué)習(xí)問題,該框架服務(wù)于多個(gè)國(guó)家 級(jí)醫(yī)療健康網(wǎng)絡(luò),也是聯(lián)邦學(xué)習(xí)系統(tǒng)構(gòu)架層面的突破。
零知識(shí)證明
零知識(shí)證明(Zero-Knowledge Proof,ZKP),是指證明者能夠在不向監(jiān)控者提供任何有用信息的情況下,使驗(yàn)證者相信某個(gè)論斷是正確的。零知識(shí)證明實(shí)際上是一種涉及雙方或更多方的協(xié)議,即雙方或更多方完成一項(xiàng)任務(wù)需要采取的一系列步驟,證明者需要向驗(yàn)證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗(yàn)證者泄露任何關(guān)于被證明消息的信息。
1985 年,S. Goldwasser、S. Micali和C. Rackoff首 次提出零知識(shí)證明(Zero-Knowledge Proof, ZKP)概念。目前在實(shí)際應(yīng)用中,某些加密貨幣就采用了這一技術(shù)路線。
可信執(zhí)行環(huán)境
可信執(zhí)行環(huán)境(TEE)是一種基于硬件的隱私保護(hù)方法,是指計(jì)算平臺(tái)上由軟硬件方法構(gòu)建的一個(gè)安全區(qū)域,可保證在安全區(qū)域內(nèi)部加載的代碼和數(shù)據(jù)在機(jī)密性和完整性方面得到保護(hù)。 2009 年,OMTP工作組率先提出一種雙系統(tǒng)解決方案:在同一個(gè)智能終端下,除多媒體操作系統(tǒng)外再提供一個(gè)隔離的安全操作系統(tǒng),這一運(yùn)行在隔離硬件之上的隔離安全操作系統(tǒng)用來專門處理敏感信息以保證信息安全,該方案是可信執(zhí)行環(huán)境的前身。
在實(shí)踐層面,目前以Intel SGX和ARM TrustZone為基礎(chǔ)的TEE技術(shù)起步較早,社區(qū)和生態(tài)已比較成熟。同時(shí),國(guó)產(chǎn)化的芯片廠商在TEE方向上已經(jīng)開始發(fā)力,國(guó)內(nèi)芯片廠商如海光、鯤鵬、飛騰、兆芯等都推出了支持可信執(zhí)行環(huán)境的技術(shù),信創(chuàng)國(guó)產(chǎn)化趨勢(shì)明顯,相關(guān)生態(tài)也正在加速建立、完善。
差分隱私
2006 年,C. Dwork提出差分隱私(Differential Privacy, DP),這一技術(shù)路線的主要原理是通過引入噪聲對(duì)數(shù)據(jù)進(jìn)行擾動(dòng),并要求輸出結(jié)果對(duì)數(shù)據(jù)集中的任意一條記錄的修改不敏感,使攻擊者難以從建模過程中交換的統(tǒng)計(jì)信息或者建模的結(jié)果反推出敏感的樣本信息。
隱私計(jì)算的未來:融合應(yīng)用
除上述技術(shù)之外,還有圖聯(lián)邦、混淆電路、不經(jīng)意傳輸?shù)榷喾N技術(shù)路線被先后提出,并不斷在科研和產(chǎn)業(yè)的推動(dòng)下得到發(fā)展和應(yīng)用。
縱觀隱私計(jì)算不同技術(shù)路線,可以發(fā)現(xiàn)各有其優(yōu)勢(shì)與不足,在可支持計(jì)算、隱私保護(hù)維度、隱私保護(hù)強(qiáng)度、安全性、性能等方面有較大差異,分別適合不同的應(yīng)用和場(chǎng)景;同時(shí),不同的技術(shù)路線目前正在持續(xù)融合、取長(zhǎng)補(bǔ)短,實(shí)現(xiàn)1+1> 2 的應(yīng)用效果。例如通過硬件加速的全同態(tài)加密算法構(gòu)建強(qiáng)隱私、高性能的縱向聯(lián)邦學(xué)習(xí)系統(tǒng),就是一個(gè)不同技術(shù)路線深度融合的典型案例。
相信在未來,不同技術(shù)路線的融合以及與人工智能、區(qū)塊鏈等新興技術(shù)的結(jié)合,能夠推動(dòng)隱私計(jì)算大規(guī)模落地,實(shí)現(xiàn)海量數(shù)據(jù)要素的價(jià)值釋放。
(推廣)