深度研究 | 可信數據空間為何如此受重視
在數字經濟的浪潮中,數據已然成為與土地、勞動力、資本、技術并駕齊驅的第五大生產要素。然而,數據的真正價值往往被鎖在孤島之中,難以釋放其變革性潛能。如何在保障數據安全與隱私的前提下,讓數據安全流動并創(chuàng)造價值?這一挑戰(zhàn)正在通過"可信數據空間"這一創(chuàng)新基礎設施得到突破性解決。
可信數據空間是對要素數據市場的市場化配置改革中深層次制度性障礙的積極響應,是推動“數據二十條”等國家數據戰(zhàn)略落地,實現“原始數據不出域、數據可用不可見、數據可控可計量”,賦能千行百業(yè),最終提升國家數字經濟競爭的關鍵舉措。
圖片
可信數據空間發(fā)展背景
1.可信數據空間概述
可信數據空間的定義是基于共識規(guī)則、互聯多方主體、實現數據資源共享的數據流通利用基礎設施,是數據要素價值共創(chuàng)的應用生態(tài),是支撐構建全國一體化數據市場的重要載體(《可信數據空間發(fā)展行動計劃(2024—2028年)》)。
可信數據空間可以促進多方參與主體在數據主權、安全與合規(guī)的前提下進行數據共享、交換和融合的綜合性解決方案框架和運營生態(tài),并通過整合多種安全技術、治理組織規(guī)則和運營模式,系統(tǒng)性地解決跨數據流通中的信任、控制、價值和創(chuàng)造問題。
可信數據空間的核心理念是構建一個不同參與方共同認可并遵守的空間,數據在空間內的流動和使用遵循統(tǒng)一的公約和標準,并通過技術手段確保數據主權策略的同時,能夠安全地向其他參與方提供數據或基于數據提供服務,從而共同創(chuàng)造價值。
2.可信數據空間受到重視的原因
我國大力發(fā)展可信數據空間,主要是在數字經濟時代,數據作為核心生產要素的價值釋放,需要一個既能保障數據主權與安全,又能促進多方信任與監(jiān)管合規(guī)高效流通的創(chuàng)新型基礎設施和治理范式。
可信數據空間發(fā)展因素
數據要素化的國家戰(zhàn)略驅動。我國前瞻性地將數據列為繼土地、勞動力、資本、技術之后的第五大生產要素,“數據二十條” 等頂層設計為數據發(fā)展繪制了宏偉藍圖,明確構建數據基礎制度,全方位發(fā)揮數據要素作用,并提出了數據產權“三權分置”(即數據資源持有權、數據處理使用權、數據產品經營權)等核心制度設計理念??尚艛祿臻g的通過連接器實現數據主權保留、通過數字合約等實現按約用數據和可控可計量,為這些要求的落地提供了基礎設施的支撐。
大模型技術發(fā)展與企業(yè)價值挖掘的內在需求。隨著企業(yè)數字化轉型的深入,跨組織、跨系統(tǒng)的數據融合與協(xié)作成為提升效率、驅動創(chuàng)新、優(yōu)化決策的必然趨勢,推動了對安全可信數據流通技術的需求,如融合多方數據的反欺詐治理等業(yè)務需求。人工智能(特別是大模型)的快速發(fā)展,對海量、高質量、多樣化的訓練數據提出了迫切需求,而這些數據往往分散在不同主體手中,需要在保障安全和隱私的前提下進行流通和利用。
破解傳統(tǒng)數據共享模式的困境。我國目前數據共享模式面臨“數據孤島”、參與各方互信不足、數據風險高,以及數據控制權失控等核心痛點,都嚴重削弱了數據潛力的發(fā)揮和數據價值的釋放。可信數據空間通過建立一套參與方共同認可的技術標準、治理規(guī)則和運營機制,在互不完全信任的參與方之間構建一個相對可信的數據協(xié)作環(huán)境,促進數據流通,激活數據要素價值。
平衡數據利用與安全保護的現實挑戰(zhàn)。隨著《數據安全法》、《個人信息保護法》等法規(guī)的深入實施,如何在保障數據安全和個人隱私的前提下,合規(guī)、高效地利用數據,成為所有市場主體面臨的共同挑戰(zhàn)??尚艛祿臻g制度通過隱私計算等技術創(chuàng)新,實現“原始數據無域、數據可用不可見、數據可控可計量”的目標。
1.關鍵能力
可信數據空間通過整合先進的安全技術、標準化的接口與協(xié)議,以及明確的各項治理規(guī)則與運營機制,構建安全、合規(guī)地進行數據共享、融合計算和價值共創(chuàng)的生態(tài)空間系統(tǒng)??尚艛祿U峡臻g應具備可信管控能力、資源交互能力和價值共創(chuàng)能力,支撐其“可連接、可管控、可共創(chuàng)”的目標。
可信管控能力
可信管控能力是可信數據空間的基石,確保數據流通利用過程的安全、合規(guī)與可信。通過對接入身份的核驗審查、數據策略管控和審計溯源實現。
- 接入核驗審查:對接入空間的主體身份(用戶、組織、連接器)、數據資源、數據產品/服務、技術工具等進行嚴格的認證和規(guī)范性審查。
- 數據策略和管控:通過數字合約明確數據使用策略(如使用范圍、目的、期限、操作權限),并利用數據使用控制、隱私計算、可信執(zhí)行環(huán)境等技術手段,確保數據在流通和使用過程中嚴格按照約定執(zhí)行,實現“數據可用不可見、可控可計量”。
- 日志存證與溯源:對數據流通和使用的全過程進行詳細、不可篡改的日志記錄,支持事后審計、責任追溯和爭議解決。區(qū)塊鏈技術常用于增強存證的可信度。
資源交互能力
資源交互能力是實現數據高效流通和互操作的基礎。通過數據發(fā)布、數據互操作和空間互聯互通實現。
- 數據/服務發(fā)布與發(fā)現:提供標準化的數據目錄和元數據管理,支持數據提供方發(fā)布其數據產品或服務,并允許數據使用方高效查詢和發(fā)現所需資源。
- 數據互操作能力:推動技術互操作(如統(tǒng)一的API接口、連接器標準)和語義互操作(如統(tǒng)一的數據模型、詞表),解決不同來源、不同格式數據之間的交互難題。
- 空間互聯互通能力:支持不同可信數據空間之間在遵循共同規(guī)則和標準的前提下實現身份互認、資源共享和服務共用,構建更廣泛的數據流通網絡。
價值共創(chuàng)能力
價值共創(chuàng)能力是可信數據空間實現數據要素價值最大化的目標。通過數據開發(fā)利用、服務方接入和權益保障實現。
- 數據開發(fā)利用環(huán)境:提供安全、合規(guī)的數據開發(fā)環(huán)境(如數據沙箱、隱私計算平臺),支持多方參與者基于空間內的數據資源進行數據分析、模型訓練、應用開發(fā)等。
- 服務方接入與協(xié)同:支持數據清洗、標注、評估、合規(guī)審計、算法模型等第三方專業(yè)服務機構接入可信數據空間生態(tài),為數據價值創(chuàng)造提供專業(yè)支撐。
- 運營規(guī)則與權益保障:建立清晰、公平、透明的可信數據空間運營規(guī)則、參與協(xié)議/公約、以及價值評估和收益分配機制,保障各參與方的合法權益,激勵價值共創(chuàng)。
可信數據空間的核心技術與架構
可信數據空間保障的技術架構設計遵循“數據主權、安全可信優(yōu)先、互聯互通開放、價值按約分配”等基本原則。
1.技術思路和原理
可信數據空間的技術思路
- 以連接器為入口,實現參與方安全接入與數據主權保留:數據提供方和使用方通過部署標準化的“可信數據空間連接器”接入可信數據空間生態(tài)。連接器作為參與方在可信數據空間中的“代理”,負責身份認證、策略執(zhí)行、封裝數據/解封、安全通信等功能,確保數據在提供方本地(可信數據空間內)得到初步控制,這是保障數據主權的技術基礎。
- 以服務平臺為樞紐,提供核心治理與運營服務:可信數據空間通常設置一個或多個“可信數據空間服務平臺”,作為可信數據空間的運營和管理中樞。服務平臺提供身份管理、連接器管理、數據/服務目錄、數字合約管理、審計管理、空間管理等基礎服務,協(xié)調參與方之間的交互,是確??臻g社區(qū)運行的核心。
- 以安全控制為核心,數據按約使用:通過集成在連接器或服務平臺中的數據使用控制技術,結合隱私計算(如聯邦學習、多方安全計算)、可信執(zhí)行環(huán)境、數據沙箱等手段,確保數據在使用過程中嚴格遵循數字一致性的約定,實現“數據可用不可見、可控可計量”的目標。
- 以互操作標準為基礎,促進跨空間、跨平臺協(xié)同:遵循統(tǒng)一的數據模型、元數據規(guī)范、API接口標準、身份認證協(xié)議等,以實現不同可信數據空間之間、以及可信數據空間與外部系統(tǒng)之間的互聯互通,打破“數據孤島”,形成更大范圍的數據要素市場。
- 以數字合約為依據,規(guī)范數據流通與使用行為:參與方之間的數據流通和使用行為,通過機器可讀、可部分自動執(zhí)行的“數字合約”進行約定。合約中明確了數據范圍、使用期限、權限、安全要求、以及可能的補償和收益分配規(guī)則,這是實現策略化管控和權益的法律與技術基礎。
2.技術架構
可信數據空間的主要組件包括可信數據空間服務平臺和連接器組件,這兩者協(xié)同工作,構成了可信數據空間的技術框架。
可信數據空間技術架構
3.算法選擇與部署遷移
可信數據空間服務平臺
服務平臺是可信數據空間運營的核心,向上連接其他行業(yè)可信數據空間或各功能節(jié)點,向下連接各參與方的連接器,其主要功能模塊包括:
- 身份管理:負責各參與方的數字身份注冊、認證、更新和注銷。通常與國家數據基礎設施的統(tǒng)一身份管理體對接或兼容;
- 連接器管理:負責空間內連接器的注冊、認證、版本校驗、運行狀態(tài)和監(jiān)測能力裝備;
- 目錄管理:提供數據產品和數據服務的登記、審核、發(fā)布功能,統(tǒng)一的數據/服務目錄,支持參與方查詢和訂閱;
- 數字合約管理:提供數字合約的模板策略、協(xié)助參與方進行合約協(xié)商與簽署、對已簽署合約進行記錄和管理、處理合約解除,向連接器下發(fā)數據交易控制指令;
- 可信數據空間管理:創(chuàng)建和管理邏輯上的可信數據空間,包括審核、配置修改、運行監(jiān)測等,注意一個物理服務平臺可支撐多個邏輯空間;
- 行為審計:對空間內的合約生成、數據發(fā)布/使用、策略執(zhí)行等關鍵操作進行日志存證,支持日志查驗、行為審計,并可能包含基于合約的計量和清算功能。
可信數據空間連接器
可信數據空間連接器作為入口,各參與方需通過連接器接入可信數據空間服務平臺、訪問和使用可信數據空間資源,同時連接器也作為策略執(zhí)行的代理。其主要功能模塊包括:
- 管理:管理連接器自身訪問策略及用戶的身份信息,支持與服務平臺的身份交互認證,執(zhí)行身份本地身份驗證;
- 數據資源管理:數據提供方將其本地數據資源(數據庫、文件、API等)接入連接器,并進行定義和描述,作為封裝數據產品的基礎;
- 數據產品管理:數據提供方基于接入的數據資源,結合使用策略,封裝成標準化的數據產品,將其元數據上架到服務平臺目錄或點對點提供給特定使用方;
- 數字合約管理:連接器參與數字合約的創(chuàng)建、協(xié)商、簽署和履行;接收并解析服務平臺下發(fā)的控制指令,執(zhí)行合約約定的數據操作;
- 數據交付:遵循數字數據合同要求,對脫數據進行加密、脫敏或通過隱私計算處理后,交付給數據使用方連接器;
- 數據使用控制(核心功能):在數據使用方側,連接器提供或集成數據使用環(huán)境,如隱私計算、數據沙箱、TEE等技術,并監(jiān)測和控制數據使用方的行為,確保其嚴格符合數字約定中約定的使用策略限制,如應用目的、操作、次數/時長限制、結果輸出等。同時,進行詳細存證。這是“數據可用不可見、可控可計量”實現的核心技術手段。
可信數據空間服務平臺與連接器功能對比
功能 | 服務平臺的 主要職責 | 連接器的 主要職責 | 兩者之間的 協(xié)作關系 |
身份管理 | 參與方(用戶、組織、連接器、服務)的數字身份注冊、認證、更新、注銷。 | 與服務平臺的身份認證交互;執(zhí)行本地身份驗證。 | 服務平臺進行權威身份認證與管理,連接器作為身份的使用和驗證端點。 |
目錄管理 | 數據產品/服務的登記、審核、發(fā)布;形成統(tǒng)一數據/服務目錄;支持查詢和訂閱;符合國家數據目錄描述規(guī)范。 | 數據提供方將本地數據產品元數據同步至服務平臺目錄;數據使用方查詢和發(fā)現數據產品。 | 服務平臺是中心化的目錄樞紐,連接器是目錄信息的生產者和消費者。 |
數字合約管理 | 提供策略模板;協(xié)助合約協(xié)商與簽署;合約備案與管理;處理合約解除;下發(fā)數據交易控制指令至連接器。 | 參與方進行數字合約;接收并解析服務平臺下發(fā)的控制指令;執(zhí)行簽名約定的數據操作。 | 服務平臺是合約管理和指令下發(fā)的中心,連接器是合約執(zhí)行的執(zhí)行單元。 |
數據交付 | 監(jiān)控和審計數據交付流程。 | 提供方對數據進行加密、脫敏、隱私計算后,發(fā)送給使用方連接器;使用方安全接收數據。 | 數據主要交付在連接器之間進行,服務平臺進行協(xié)調和監(jiān)督。 |
數據使用控制 | 提供數據沙箱、隱私計算平臺等集中安全計算環(huán)境;制定和下發(fā)數據使用策略;審計數據使用行為。 | 提供隱私計算、沙箱、TEE等使用環(huán)境;實時監(jiān)測和控制數據使用行為,確保嚴格符合數字合約策略;并對使用過程詳細存證。 | 服務平臺定義策略并提供部分環(huán)境,連接器是用戶端的最終執(zhí)行者和監(jiān)控者的策略,是“數據可用不可見、可控可計量”的關鍵。 |
審計、日志記錄 | 對空間內關鍵操作進行日志存證;支持日志查驗、審計估值;可能包含基于計量的計量和結算功能。 | 將本地執(zhí)行的數據訪問、策略執(zhí)行、計算過程元數據等關鍵操作日志安全上傳至服務平臺或提供查詢接口。 | 連接器產生操作日志,服務平臺進行匯總、存儲、分析并提供審計服務。 |
可信數據空間的應用實例
組織可以通過可信數據空間提升其在數據安全可信共享、隱私保護計算,以及數據流通全審計流程追溯與合規(guī)舉證的核心能力,能夠更安全、更合規(guī)、更高效地釋放價值數據,賦能業(yè)務創(chuàng)新和數字化轉型,從而直接響應并解決傳統(tǒng)數據共享存在的“不愿意共享”、“不敢共享”、“不能共享”等痛點。
1.利用可信數據空間提升
數據安全可信共享能力。
可信數據空間可以實現與外部組織進行數據共享時的信任度、安全性和合規(guī)性。數據提供方能夠更好地維護數據主權和控制權,數據使用方合規(guī)地獲取并利用所需數據。
業(yè)務案例
某金融機構通過行業(yè)可信數據空間平臺,將部分信貸風險相關數據和風險模型提供給合作的小貸公司用于輔助風控管理,雙方通過平臺簽訂數字合約,明確數據使用范圍和期限,利用平臺對小貸公司的使用行為進行審計,實現了小貸公司獲取金融風控數據實現風控管理。
某制造企業(yè)部署可信數據空間平臺,并要求供應商通過可信連接器連接,通過平臺與多家供應商進行生產計劃、設計圖紙等數據的安全共享,并通過平臺進行統(tǒng)一身份和訪問權限管理,給不同類型的數據設定不同的安全策略并進行監(jiān)控和記錄,實現了制造企業(yè)與供應商安全共享生產數據的供應鏈優(yōu)化管理。
2.利用可信數據空間提升數據可用不可見”的能力
當數據提供方需要共享的數據涉及個人信息或商業(yè)機密時,不宜直接暴露原始數據時,可以利用可信數據空間服務平臺或連接器集成的隱私計算能力(如聯邦學習、多方安全計算)或可信執(zhí)行環(huán)境。數據提供方將數據或特征安全地加載到可信數據空間內的安全計算環(huán)境中,數據使用方提交計算任務或模型,計算過程在保護原始數據不泄露的前提下進行,最終僅輸出約定的計算結果或模型更新。使得組織能夠在嚴格保護敏感數據隱私和商業(yè)秘密的前提下,跟多地參與到高價值的多方數據融合分析、聯合建模、聯合風控等應用中,有效打破數據孤島,釋放數據要素的乘數效應。
業(yè)務案例
多家醫(yī)療機構利用基于可信數據空間架構的聯邦學習平臺,各自在本地利用患者數據訓練模型參數,僅將加密的參數上傳至可信數據空間的協(xié)調節(jié)點進行聚合,共同構建精準的疾病診斷AI模型,而原始患者數據始終不出各醫(yī)療機構。
多家銀行聯合開展識別跨機構的欺詐風險或進行多頭借貸分析,但不能直接共享各自的客戶數據??梢酝ㄟ^一個金融行業(yè)可信數據空間,利用大模型共同計算風險評分或查詢黑名單交集,而各銀行的原始客戶數據不出本地或其可信連接器的安全區(qū)。
醫(yī)療機構與科研機構或藥企合作進行疾病研究或新藥研發(fā),但患者數據高度敏感。在這種情況下,可以通過可信數據空間,利用聯邦學習技術,各醫(yī)療機構在本地用患者數據訓練模型,僅將加密的模型參數上傳至可信數據空間的協(xié)調節(jié)點進行聚合,共同構建一個更精準的AI模型,而原始患者數據始終不出各醫(yī)療機構。
3.利用可信數據空間提升全流程審計、追溯與合規(guī)舉證能力
可信數據空間平臺和連接器可以對所有關鍵操作進行審計的強制要求(如參與方注冊與認證、數據產品發(fā)布與訂閱、數字約定簽署與變更、數據訪問與交付、策略執(zhí)行策略、計算過程數據等),形成詳細、持續(xù)且防止篡改的日志記錄,并且可以將區(qū)塊鏈技術集成到可信數據空間中,用于增強關鍵日志和合約的不可篡改性。增強了數據流通的透明度和合規(guī)性舉證能力。當發(fā)生數據泄露安全事件或數據爭議時,能夠提供可靠的證鏈,快速定位問題、追溯責任,對監(jiān)管機構證明其盡職免責。
業(yè)務案例
在公共數據授權運營的場景中(如政府公共數據開放服務、城市可信數據空間探索),政府數據管理部門作為監(jiān)管方或數據提供方,可以通過可信數據空間平臺的審計接口,查閱授權運營機構對公共數據的調用記錄、數據產品的開發(fā)過程、以及最終服務輸出的情況,確保其行為符合授權協(xié)議和《數據安全法》、《個人信息保護法》等相關法規(guī)。