學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于區塊鏈的大數據確權方案

發布時間:2020-03-25所屬分類:計算機職稱論文瀏覽:1

摘 要: 摘要數據確權一直是大數據交易面臨的挑戰性之一.傳統的確權手段采用提交權屬證明和專家評審的模式,但是缺乏技術可信度,且存在潛在的篡改等不可控因素.為解決這些問題,迫切需要操作性強的確權方案.基于區塊鏈技術和數字水印技術,提出了一種新的大數據確權方案

  摘要數據確權一直是大數據交易面臨的挑戰性之一.傳統的確權手段采用提交權屬證明和專家評審的模式,但是缺乏技術可信度,且存在潛在的篡改等不可控因素.為解決這些問題,迫切需要操作性強的確權方案.基于區塊鏈技術和數字水印技術,提出了一種新的大數據確權方案.首先,引入審計中心和水印中心,以分離大數據完整性審計和水印生成的職責.其次,基于數據持有性證明技術和抽樣技術,實現對大數據完整性的輕量級審計.再次,利用數字水印技術的特殊安全性質,實現對大數據起源的確認.最后,針對整個確權過程中涉及到的證據的完整性和持久性,利用區塊鏈的原生特點實現確權結果與相關證據的強一致性.正確性和安全性分析結果表明,該方案能夠為大數據的所有權界定提供新的技術思路和方法.

基于區塊鏈的大數據確權方案

  關鍵詞數據確權,區塊鏈,數字水印技術,密碼學

  1引言

  數據是繼物質、能源之后的第三大基礎性戰略資源.2016年12月,國務院印發的«“十三五”國家信息化規劃»中明確指出,優先開展數據資源共享開放行動.在推進數據資源開放共享的實踐中,須解決的首要問題是[1]:數據作為一種重要資產,其流通和應用必然涉及數據的所有權問題.明晰數據的所有權,是大數據交易的前提和基礎.數據的權屬關系不清晰,一方面可能造成后續開發利用中產生權屬糾紛問題;更嚴重的是,在數據歸屬模糊的情況下進行大數據分析關聯,也難以界定權責歸屬,數據安全和個人隱私難以得到保障.這些問題嚴重制約著大數據的共享開放實踐.因此,數據確權在大數據時代尤為關鍵,關系到大數據產業的創新活力及大數據交易市場的繁榮.

  相關期刊推薦:《計算機科學》主要報導國內外計算機科學與技術的發展動態,涉及面廣的方法論與技術,和反映新苗頭、能起承先啟后作用的研究成果。內容涉及程序理論、計算機軟件、計算機網絡與信息、數據庫、人工智能、人機界面、國際會議、應用等。雜志報導特點是“前沿學科”與“基礎研究”相結合;“核心核術”與“支撐技術”相結合;“倡導”與“爭鳴”相結合。

  數據確權[1]一般是確定數據的權利人,即誰擁有對數據的所有權、占有權、使用權、受益權,以及對個人隱私權的保護責任等.本文研究數據確權時,主要聚焦于數據的所有權,即數據歸屬問題.具體地說,產生這批數據或者第一個收集這些數據的企業主體就是這批數據的所有者.通過其他任何方式(交易等)獲得這批數據的企業或個人都只擁有使用權,而無所有權.目前,學術界對數據確權的研究成果相對較少.彭云[2]于2016年在大數據環境下研究了數據確權的核心問題.同年,涂燕輝[3]從法律的角度論述了數據確權的緊迫性和必要性.郭兵等人[4]于2017年以保護個人數據產權、知情權、隱私權和收益權為核心,提出了一種個人大數據資產管理與增值服務系統.王帥宇等人[5]于2017年公開了一種基于區塊鏈技術的大數據確權方法及系統,但該方法未涉及對大數據源頭的確認.因此,亟須從技術角度給出一種可靠且可操作性強的大數據確權方法.

  目前,比較有代表性的確權方法是貴陽大數據交易所從管理角度提出的“提交權屬證明+專家評審”模式.在此確權模式下,首先,大數據的擁有者提交權屬證明;其次,大數據交易所組織專家進行評審;最后,大數據交易所公布結果.專家在評審過程中有可能摻雜主觀情感甚至偏見,破壞數據確權的公平性;且大數據交易所的內部人員出于利益關系可能存在惡意修改等行為.大數據交易所缺乏一種機制來永久保存評審材料和評審結果以備審計,當前交易所一般采用紙質文檔和電子文檔保存的方式,存在易丟失和易被篡改等問題.此外,鑒于大數據數據量大的特性,如何實現在不發送整批大數據的前提下高效、輕量地完成數據確權也是一大挑戰.這些不可控因素表明,在技術上尋找一種解決方案迫在眉睫.

  針對這些挑戰,本文基于數字水印技術[6]和區塊鏈技術[7],提出了一種新的大數據確權方案,該方案具有確權的公平性、完整性和不可欺騙性.在初始化階段,數據源供應商首先將大數據分塊,并采用BLS短簽名方案[8]對數據塊取認證器,利用認證器的同態特性使數據源供應商不必發送原始數據;在確權請求、證據挑戰和驗證階段,引入審計中心,數據源供應商和審計中心基于隱私保護數據持有性證明[9]和抽樣技術[10]交互完成大數據的完整性審計,其中抽樣技術確保了審計中心在挑戰時抽取數據塊的隨機性;在水印生成和嵌入階段,引入水印中心,由數據源供應商將能唯一標識自己身份信息的數據發送給水印中心,請求水印生成.水印中心將生成的水印發送給數據源供應商,由數據源供應商完成水印嵌入數據塊的工作.在登記上鏈和查詢階段,基于區塊鏈的內生優勢(分布式、不可篡改、共享賬本)實現確權結果和相關證據的鏈上高冗余保存,確保確權結果的完整性及不可篡改性.本文力圖在技術上杜絕傳統確權模式下大數據交易所篡改確權結果的完整性以及破壞確權的公平性,確保數據源供應商的利益,進一步為大數據交易市場的健康有序運作提供技術支撐.

  本文第2節簡要介紹雙線性映射、BLS短簽名方案、同態認證器、區塊鏈和數字水印技術;第3節提出一種大數據確權方案;第4節對大數據確權方案進行正確性分析、安全性分析和復雜度分析;最后總結全文.

  2.5數字水印技術

  數字水印是指將標識信息嵌入到數據載體內部,以達到版本保護、保密通信、文件真偽鑒別和產品標識等目的.嵌入的信息不影響數據載體的使用,并且不易被提取或修改.一旦發生所有權糾紛,可以將水印提取出來進行檢測,從而證明版權的歸屬.一個完整的水印系統包括水印的生成、嵌入、檢測和提取.

  3大數據確權方案

  3.1系統模型

  本方案包括4個主體單元:數據源供應商P,審計中心T,水印中心C,Fabric區塊鏈權屬登記商業網絡B.圖1是本方案中使用的模型.

  本方案中各主體單元首先向證書機構CA申請公鑰數字證書(同時完成認證接入);其次,數據源供應商P對大數據進行分塊,運用BLS短簽名方案對數據塊分別取認證器,并把數據塊數、數據塊認證器、大數據標識符ID的簽名等與大數據確權相關的確權請求信息發送給審計中心T;再次,審計中心T利用數據源供應商P的公鑰驗證簽名的正確性,若驗證通過,則審計中心T會向數據源供應商P發送證據挑戰請求;最后,審計中心T收到證據后,利用雙線性對的雙線性質來驗證等式是否成立,若成立,則數據源供應商P向水印中心C申請生成水印并完成水印嵌入.審計中心T和水印中心C將挑戰證據、相關確權信息、水印以及相關元信息以JSON的格式封裝成一筆交易并發送給數據源供應商P,待數據源供應商P簽名以后再將其發送到Fabric區塊鏈權屬登記商業網絡B.網絡中的共識節點在鑒定交易中簽名的合法性后,按照共識算法的要求最終將權屬信息寫入Fabric區塊鏈.

  3.2方案的構造

  3.2.1參數

  方案中用到的相關參數及其意義如下.

  1)審計中心T:負責大數據完整性審計事宜實施的專業機構.

  2)數據源供應商P:發起大數據確權請求的實體單元,一般為政府部門或互聯網企業.

  3)水印中心C:負責為數據源供應商P生成水印,實現大數據起源的確認.

  4)Fabric區塊鏈權屬登記商業網絡B:負責將審計中心T和水印中心C聯合構造的數據(交易)登記上鏈.該網絡包括注冊中心CA、數據源供應商P、節點X等負責共識的主體單元,其中CA負責對其他主體單元進行身份核實并簽發公鑰證書。

  4.2安全性分析

  本節將從公平性、完整性、不可欺騙性3方面來分析大數據確權方案.

  定理1該大數據確權方案滿足確權公平性.

  證明:首先,在確權方案的初始化階段,數據源供應商P、審計中心T以及區塊鏈權屬登記商業網絡B均向CA申請公鑰證書,參與主體的身份得到了確認,交互行為處在相對可靠的環境中,同時基于CA可以實現行為不可抵賴性.其次,方案中采用“水印中心C+審計中心T”替代傳統方法中大數據交易所負責確權實施的模式,消除了大數據交易所內部人員和專家評審過程中帶來的篡改和主觀威脅等,同時在證據挑戰階段,式(3)的可公開驗證性可以進一步增強審計中心T在確權過程中的公平性.本方案將確權中的完整性審計和水印分發進行分離,審計中心T負責大數據完整性的審計工作,水印中心C負責大數據水印的生成,數據源供應商P負責將水印嵌入到數據塊中.數據上鏈也需要水印中心C、審計中心T和數據源供應商P三方簽名后才能有效,缺少任何一方,均完成不了該過程.

  定理2該大數據確權方案滿足確權數據的完整性.

  證明:確權數據的完整性一方面是指已經完成確權之后的大數據的完整性.在確權方案的初始化階段,數據源供應商P首先對D進行分塊,將分塊數據記為di,其中1≤i≤n,并且采用BLS短簽名方案對每個數據塊di取認證器σi.然后,供應商P將認證器集合和大數據ID的標簽{ψ={σi}1≤i≤n,tag}一起發送給審計中心T,審計中心T收到后,若供應商P試圖對大數據D本身進行修改或者對分塊數據di進行修改,則只有供應商P能夠重新找到一個di′≠di使得(H(Wi)

  定理3該大數據確權方案具有不可欺騙性.

  證明:初始化階段,數據源供應商P首先對D進行分塊,將分塊數據記為di,其中1≤i≤n,并且采用BLS短簽名方案對每個數據塊di取認證器σi.在確權請求、證據挑戰和驗證階段,數據源供應商P將認證器集合ψ發給審計中心T.數據源供應商P用自己的私鑰x對數據塊di簽名,具有不可欺騙性.在證據挑戰時,利用BLS簽名機制的聚合性,P將挑戰請求chal={(i,vi)}s1≤i≤sc聚合成σ發送給審計中心T.審計中心T會驗證數據源供應商P的簽名,只有驗證成功,數據源供應商P才會向水印中心C請求水印生成且在后續參與交易上鏈.水印是由水印中心C生成的,水印中心C會將水印記錄在鏈上.后期的數據使用者在交易這批數據時可以從大數據中提取出水印,進而與鏈上的水印進行比對,水印一致時提取的水印才是合法的.在登記上鏈和查詢階段,審計中心T和水印中心C將確權結果和相關證據以一筆交易的形式發給區塊鏈權屬登記商業網絡B,其中的共識節點會驗證審計中心T和水印中心C發起的交易的真實性,只有通過驗證的交易才會寫入鏈上.因此,整個確權過程中的參與確權請求、證據挑戰和水印生成的主體行為均具備不可欺騙性.

  4.3復雜度分析

  下面給出本方案在大數據完整性審計、水印生成和確權相關證據組成的交易上鏈三階段的復雜度分析.本方案的通信復雜度由確權過程中(審計、水印生成和交易上鏈)的通信輪數表示,如表1所列.

  審計階段的計算復雜度由兩部分組成,分別是數據源供應商的O(n)和審計中心的O(c),通信復雜度為O(1),其中n為大數據分塊數目,c為隨機抽取的數據塊數.水印生成階段的計算復雜度主要是水印中心產生水印的O(qn),通信復雜度為O(1),其中q為給數據塊嵌入水印的抽取比例.交易上鏈階段的計算復雜度主要由審計中心T、水印中心C和數據源供應商P計算簽名組成,共計O(1),通信復雜度為O(1).

  結束語本文引入審計中心和水印中心,以分離大數據的完整性審計和證明數據所有權的水印生成和嵌入,進而替代傳統確權中大數據交易所直接實施確權的組織和評審以及由此引發的確權不公平和不可信局面;其次,鑒于大數據交易所負責確權結果的保存給確權結果的完整性帶來了篡改威脅和不確定性風險,本文引入區塊鏈,利用其分布式、高度冗余等特點將確權結果的保存從傳統的大數據交易所一家轉入整個大數據交易生態圈,實現了確權結果的始終一致性.在本文工作的基礎上,下一步將基于區塊鏈研究大數據交易權的流轉,力圖實現大數據交易生命周期中的可追責性.

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频