潮科技 | 隱私計算應用場景詳解
隱私計算(Privacy Computing),指在保護數據本身不對外泄露的前提下實現數據分析計算的一類信息技術,主要分為可信硬件和密碼學兩大技術領域。隱私計算是目前實現數據安全和數據合規分享的技術路徑,本文將從技術概念介紹和應用場景出發進行介紹。
實現隱私計算的相關技術
當前實現隱私計算的技術主要可分為可信計算和密碼學兩大方向。
可信硬件
可信硬件指可信執行環境,核心思想是構建一個安全的硬件區域,各方數據統一匯聚到該區域內進行計算。比較有代表性的是Intel-SGX、ARM-TrustZone、Ucloud-安全屋等。特點是速度快、語言更友好、算法更通用。
密碼學
密碼學指用算法實現對計算過程中的數據保護,以多方安全計算、聯邦學習等為代表。
-
多方安全計算
即MPC,針對無可信第三方情況下,安全地進行多方協同的計算。在一個分布式網絡中,多個參與實體各自持有秘密輸入,各方希望共同完成對某函數的計算,要求每個參與實體除計算結果外,均不能得到其他參與實體的任何輸入信息。多方安全計算包含的基礎技術有很多,比如同態加密、秘密分享、不經意傳輸、混淆電路等。
多方安全計算更多地是解決初級的算子,比如加、減、乘、求交等運算。比較有代表性的企業和平臺是華控清交(Privpy)、螞蟻金服(Morse)、富數科技(Avatar)、百度(點石)等。
-
聯邦學習
即Federated Learning,基于多方數據進行聯合建模,各自原始數據不對外輸出,由中心方進行協調的建模,都可成為聯邦學習。
聯邦學習更多地是解決聯合建模的業務問題,比如信貸風控中的常用的邏輯回歸建模評分、精準營銷中的常用的XGBOOST分類等建模。比較有代表性的企業和平臺是微眾銀行(Fate)、螞蟻金服(Morse)、富數科技(Avatar)、平安科技(蜂巢)、數牘科技等。(注:以上部分參考中國信通院對隱私計算的相關定義)
隱私計算的客戶與場景
由于多行業均存在數據合規流通的需求,隱私計算的落地場景也分散于各行各業。以下列出了政務、醫療、金融、廣告、供應鏈等行業對隱私計算的具體需求,希望介紹隱私計算的落地方向。
隱私計算"客戶"拓撲圖
政務大數據
當數據成為生產要素之一,將政務大數據賦能于新基建下的各行各業也成為一個重要課題。因此,政務大數據機構是隱私計算的重要客戶之一,具體包括司法數據、社保數據、公積金數據、稅務數據、水電燃氣數據、交通數據、違章數據等。
政務大數據
政務大數據的隱私計算應用場景
舉例來說,智慧城市就是一個復雜、錯綜、協助、共創的業務生態,包括信用、安保、能源、交通、規劃、環保、文旅等各個行業,業務數據涉及到跨部門協同。智慧城市中打通以人為中心的數據也是“城市數據中臺”的概念,這需要通過對城市居民的多維度信用評級,授予或者限制更多的權限。要做到對個人聯合風控,其中需要橫向打通的數據包括交通出行數據、水電燃氣數據、公安數據、征信數據等。
醫療科研
在醫療機構中,病例數據作為最需要保護隱私安全的數據,對醫療科研與病情推斷具有重要的價值。然而單個醫療機構的數據樣本不足以支撐大規模的模型訓練,傳統的做法是將病例數據匯總、統計、銷毀,這種操作是極其不安全的。
而在隱私計算領域,采用多方安全計算的方式,可以保證各家醫療機構數據不出庫,加密計算,最終得到統計結果。
醫療科研
銀行金融業務
銀行作為傳統金融機構的代表,在科技賦能的進化中,必然涉及到與外部數據的聯合建模。銀行也是隱私計算最可能率先完全落地的領域。
首先,銀行找到存量用戶需補全畫像標簽,才能服務于流失召回、交叉營銷場景,這非常依賴于銀行外部的數據。而隱私計算中的匿蹤查詢可以保證銀行在查詢外部數據的時候,避免用戶信息被緩存。并且,小微企業貸等對個人或者企業進行信貸評估的場景,也需要依賴外部數據源做聯合建模評估。
銀行金融業務
保險營銷與定價
保險公司從線下發展到線上獲客,對精準獲取潛客需求極大,這里的精準度直接影響觸達的成本。另外,“定價失靈”是當前財產險行業經營面臨的一個突出問題,主要表現為保費不足和未決賠款準備金不利發展。之所以會有“定價失靈”的現象,既有數據、模型和精算技術等方面的“前定價管理”原因,也有風險識別、核保、承保、銷售、理賠、費用管控和準備金評估等方面的“后定價管理”原因。隱私計算可以為保險聯合定價提供多維度的數據支撐。
基金管理
在母基金的管理中,我們需要計算每個基金的真實收益情況。而基金的持倉信息是一個非常重要的私密信息,它代表了基金的價值判斷和策略導向,也是基金公司的核心機密。這里的矛盾在于,一方面母基金出于管理需要信息共享,另一方面是基金本身卻需要保護這些商業信息,傳統方法必然導致一方的訴求無法得到滿足。使用多方安全計算,不僅能夠同時滿足雙發的利益訴求,甚至可以讓基金信息得到有效的政府監管、防止出現市場結構性風險,同時保證商業信息不被泄露。
大數據增值服務
像運營商、SDK廠商、支付廠商等機構,在開展業務的同時會積累大量的用戶數據。它們通常會成立一個大數據子公司來做數據增值業務。傳統的API直接調用和線下聯合建模的方式已經不滿足數據安全的相關要求。隱私計算技術也可服務于數據公司的對外服務平臺,成為數據合規合法輸出價值的一種解決方案。
廣告平臺聯合營銷
媒體平臺對廣告主進行營銷投放過程中,需要用甲方的用戶數據樣本進行聯合建模,傳統的標簽畫像篩選更多地是憑領域經驗,通過機器學習建模可以提高營銷的ROI。聯邦學習可以滿足在廣告主的數據不出庫的前提下,得到營銷投放模型。
廣告平臺聯合營銷
供應鏈金融
對供應鏈上下游企業而言,如何構建一個信息對稱共享、核心企業信用價值可傳遞、商票可拆分流程是一個挑戰。廠商可以基于區塊鏈和密碼學算法,提供金融資產數字化驗證的方案,使企業能夠將企業應收賬款進行數字化資產登記,形成不可篡改的數據記錄,并實現實時信息共享。
同時通過參與方分布式賬本,參與方可以得到資產確認,將企業信用轉化成數字資產。此外,審計入口也能方便監管機構審計和查看平臺的資產交易情況。最重要的是,在傳統區塊鏈只能保證數據的不可修改性,通過多方安全計算和零知識證明等加密技術,可幫助區塊鏈實現智能合約的公開審計確認能力與實際數據保密性的分離,讓企業不再擔心核心商業信息的泄露。
高校科研
高校的許多研究課題會脫離企業的真實數據實驗環境,而聯邦學習既能讓高校科研使用企業真實數據進行課題研究,又可以保護企業業務數據不對外輸出。這對企業和高校聯合培養人才、挖掘科研價值具備促進作用。
量化投資模型
除了leval2等傳統的交易所數據,量化投資領域更大的價值是通過互聯網大數據的挖掘得到異類指標,這些指標通常被訓練成投資決策模型。傳統的私募基金通常將數據采購到本地,或者在數據服務端進行模型訓練,這種方式的弊端是會造成投資模型的數據源側安全性問題。
聯邦學習可以將多方有價值的數據進行聯合建模,訓練出綜合的決策模型,而模型實施部署采用分布式加密的方式,任何一側的合作數據源都無法獲得完整的原始數據。
總結
用戶隱私安全是社會生產力發展到一定階段的必然產物。當前很難回答隱私計算的具體市場規模,但在理想狀況中,隱私計算的應用場景存在于幾乎所有需要多方使用數據的地方,以上提到的企業和機構都需要數據合規分享的技術來協助業務開展。