8月12日消息,Gartner曾預測2021年的戰略技術趨勢,以聯邦學習為代表的隱私增強技術位列其中。聯邦學習是解決數據孤島的較佳路徑嗎?對隱私的保護是否能一勞永逸?如何盡可能地提高數據隱私性和實用性?這樣的技術與企業需求之間是否存在缺口,又將如何影響企業的發展?
一年多前,在一個金融服務業高管云集的房間有人提問:“誰聽說過聯邦學習?”一只手舉了起來,來自房間里的一位風險投資家。其他包括CIO和CDO在內沒有一位高管對這項技術有所了解,盡管他們的企業很可能已經在使用聯邦學習技術。
雖然高管不需要了解企業使用的每一項技術,但當企業尋求與合作伙伴進行安全有保障的連接時,隱私增強技術(PETs)中的聯邦學習應該迅速被納入關于數據協作的戰略討論。隱私增強技術起源于學術界,早期被政府機構和高度監管的行業采用。相關技術在不放棄對數據的控制或不損害消費者隱私的情況下可加速安全數據協作、建立客戶智能(CI)和提升數據價值,已經進入了更廣泛的商業應用場景。
由于隱私監管和大型科技公司限制訪問,數據的供應越來越少。隨著數據隱私和安全成為全球趨勢,這就很容易看出為什么這項已經存在幾十年的技術現在又出現在一些希望強化數據基礎、實現真實客戶中心化的企業視野中。在升級數據戰略的過程中,其他經常提及的隱私增強技術還包括差異隱私(differential privacy)、合成數據(synthetic data)、安全多方計算(Secure Multiparty Computation,SMPC)和同態加密(homomorphic encryption)。
隱私增強技術可以解決什么?
隱私增強技術已經存在了幾十年,大部分時間僅在幕后發揮作用。目前被多數人熟知的聯邦學習是隱私增強技術的一種,可用于保存敏感信息(如衛星位置、銀行對賬單和醫療圖像),使獲得許可的一方能夠跨云平臺、基礎設施和地理位置安全訪問信息,而無需將其移動或復制到任何地方。
那么聯邦學習服務于什么?舉個簡單的例子。假設用戶人群相似的品牌A和B,它們擁有不同的數據。品牌A有用戶標簽數據,品牌B有會員數據和交易數據。這兩個企業按照數據隱私準則是不能直接地把雙方數據加以合并的,因為他們各自的用戶并沒有機會授權這樣做。
那么,現在的問題是如何在A和B各端建立高質量的人群模型。但是,又由于數據不完整(例如企業A缺少交易數據,企業B缺少標簽數據),或者數據不充分(數據量不足以建立好的模型),各端有可能無法建立模型或效果不理想。
聯邦學習的目的是解決這個問題:它能夠做到各個企業的自有數據不出本地,聯邦系統可以通過加密機制下的參數交換方式,在不違反數據隱私保護法規的情況下,建立一個虛擬的共有模型。這個虛擬模型就好像大家把數據聚合在一起建立的較優模型一樣。
因此,在這樣的一個機制下,數據本身并不移動,也不會泄露用戶隱私或對數據安全產生潛在風險,聯邦系統為生態建立了“win-win”的策略,也解決了數據孤島的挑戰。
那么,在目前的數字時代,聯邦學習是解決數據隱私和安全的較佳路徑么?
隱私保護沒有一勞永逸
Gartner曾預測2021年的戰略技術趨勢,隱私增強技術位列其中。隱私增強技術的獨特之處在于,雖然所有技術都有其優點,但沒有一種技術應該比另一種技術“更好”或“更差”,因為對隱私的保護不是一勞永逸的。企業希望可配置的控件能夠定制化地滿足需求并加速合作關系的建立和結果的達成。大多數隱私增強技術都有不同的用途,根據企業的業務需求,它們之間的配合可能會達到更好的效果。
技術服務商要能闡釋他們在幫助企業遵守數據隱私法規并建立消費者信任時,使用了什么方法以及每種方法的利弊。以下是企業可以向技術服務商提出的六組問題,以便更好地了解他們的技術如何支持企業當前和未來的需求:
多方支持:我能否在多方參與的環境中實施我自己的隱私標準和數據控制?還是我必須接受其他人的做法?安全性:我可以將我的數據保留在某個安全范圍內嗎?或者,與他人合作是否需要將數據移動到我的數據基礎架構之外?靈活性:支持哪些應用場景,不支持哪些?速度:你的技術是否會減緩我的分析、查詢或處理速度?如果是,減速是線性的(如10%減速)還是指數性的(如100倍減速)?效用:我的團隊使用可用數據得出的洞察是否準確且可執行?
在不妥協數據隱私的前提下,盡可能地提高數據實用性
正如Winterberry不久前的一份報告顯示,在美國和英國,70%受訪高管目前正在或計劃“共享一方數據以進行用戶洞察、激活及效果測量或歸因”。其中一些企業可能還不知道,隱私增強技術支持數據協作盡可能提高隱私和實用性,擴展了一方數據的可能性。使用傳統的數據協作模式,敏感信息可能會要求刪除個人標識符以保護隱私。然而,其中一些信息對于準確、無偏見地理解受眾是必要的。與其將完整的數據表提供給有權限的特定數據科學家和分析人員,不如讓原始數據與使用隱私增強技術的數據分析人員保持距離,這樣做速度更快、更有效,而且十分重要的是,隱私意識強且以客戶為中心。
然而以聯邦學習為代表的隱私增強技術也存在著實施周期長、整體預算較高等問題,對于尋求同樣效果但希望采用更簡單易行方案的品牌,LiveRamp的標識符(ID)轉換解決方案--Vault是填補隱私增強技術與企業需求缺口的更佳選擇。
填補隱私增強技術與企業需求之間的缺口,實現真正的以客戶為中心
Vault是由鏈睿中國提供的軟件服務,基于LiveRamp在隱私保護領域的強大綜合實力,通過高效并安全地假名化并加密ID(Identity,用于營銷以及數據分析環境中的用戶身份),在隱私合規的前提下解決營銷數據跨平臺進行交互的挑戰。Vault可處理任何ID,通過Vault加密后的ID被稱為RampID,它不可逆轉、可在任何客戶指定的環境中部署。Vault成熟的密鑰管理體系確保RampID生成的一致性,并可通過集群化部署提高RampID生成效率。
通過Vault,品牌可用更低的成本更簡單地實現聯邦學習等技術的多種應用場景,實現安全的數據連接和有效的數據協作:
場景一:安全第三方數據標簽增補
品牌希望對其一方數據(如在線及線下交易數據、會員手機號、潛在用戶設備號)等,利用第三方數據對其進行標簽增補,完善用戶畫像,強化數據價值。在此過程中,Vault將加密后的品牌數據生成RampID,隨后將RampID上傳至專為此品牌設置的安全環境中,之后將RampID發送給第三方數據服務商。服務商在其LiveRamp保險柜中將匹配上的RampID添加標簽,最終返回到品牌自己控制的環境中。在此過程中雙方的匹配是基于假名化并加密過后的RampID,而沒有匹配上的RampID也無法逆向工程再辨識以及使用,以保障彼此的一方數據安全。
場景二:安全多方數據融合進行分析、建模等
品牌需要將自己的一方數據與多方數據進行融合,以支持其用戶畫像分析、建模等應用。在此過程中,品牌和其他各方分別將各自的數據通過Vault生成RampID,上傳至鏈睿為品牌設置的安全環境中,在獲得客戶授權的前提下統一用于報告、建模等數據分析與應用流程,實現安全跨領域融合分析數據的目的。
場景三:安全上傳一方數據至CDP等其他外部平臺
對于希望將一方數據上傳CDP等這樣的外部平臺的需求,安全有保障地上傳數據是關鍵。通過Vault,不論是品牌的一方數據,還是LiveRamp連接的數據合作伙伴提供的二、三方數據,都將通過加密生成RampID后發送至CDP。經過CDP的多種處理,數據以RampID的形式發送至媒體發布平臺,應用于數字營銷的各個環節,包括洞察、激活、測量等等。通過一方數據及二、三方數據的安全上傳,品牌可實現安全有效的數據連接與協作,更加深入地分析消費者并全面賦能數據,從而助力提升用戶體驗、提高數據價值。
綜上所述,LiveRamp Vault作為隱私增強技術的便捷應用,與聯邦學習技術可殊途同歸的達成同樣的數據隱私保護效果,打破數據孤島,安全有保障地實現數據連接和數據協作。在此基礎之上,品牌能夠強化數據策略,真正實現以客戶為中心,擴展數據應用場景,提升數據價值,從而贏得“用戶”這一長期競爭中的關鍵優勢。
許多公司多年來一直宣稱以客戶為中心,在數字和隱私第一的以客戶為中心的標準已經提高的今日,很多公司必須抓緊追趕才不會掉隊。隱私增強技術正不斷證明他們能夠能夠縮小差距、加快數據戰略、構建真正的單一客戶視圖,并始終如一地提供下一代體驗,為企業建立競爭優勢。要實現真正的以客戶為中心,隱私增強技術方案必須盡快進入企業的數據戰略乃至整體發展戰略中。
(原標題:聯邦學習、同態加密……關于數據協作,你不可不知的隱私增強技術)