發布時間:2020-03-26所屬分類:計算機職稱論文瀏覽:1次
摘 要: 摘 要盡管數據流動和交易是大勢所趨,但當前數據交易的熱情并不高漲。文章分析了數據的特殊性和當前數據交易的模式,數據交易平臺有能力留存交易數據成為交易雙方的潛在威脅,成為數據交易的障礙;趯γ艽a技術、區塊鏈技術和開源開放機制的研究,設計一種
摘 要盡管數據流動和交易是大勢所趨,但當前數據交易的熱情并不高漲。文章分析了數據的特殊性和當前數據交易的模式,數據交易平臺有能力留存交易數據成為交易雙方的潛在威脅,成為數據交易的障礙;趯γ艽a技術、區塊鏈技術和開源開放機制的研究,設計一種去中心化的新型交易平臺,從技術上保證平臺沒有機會查看、復制和留存交易數據,實現交易數據只在交易雙方中安全流轉。
關鍵詞數據交易;區塊鏈;密碼技術;去中心化;共享
背景
隨著云計算、物聯網的發展,越來越多的數據被記錄,我們已經進入大數據時代。數據的共享和交易是大勢所趨和市場的必然需求。
只有多維度的數據交叉,才能發揮數據的最大價值,但沒有一家機構能獲得全數據、全樣本。各地紛紛建立起大數據交易中心,并配套優惠政策,然而,絕大多數企業并不愿意將自己的數據通過交易中心進行交易。
在商品經濟時代,商品交易平臺,無論是線下的大賣場模式(國美、蘇寧),還是線上的商城模式(天貓、京東)都加速了商品的流通,對經濟發展起到了巨大的推動作用。大數據交易中心目標同樣是鏈接供需雙方,加速數據流通,但數據企業并不買賬。
數據企業不把數據拿出來共享交易的擔心有兩方面。
1)數據合規性。什么樣的數據可以共享和交易?數據拿出來會不會被投訴或者處罰?謹慎的數據擁有者為了規避風險,不求有功,但求無過,索性就不拿出來。
2)數據安全和權益保障。數據在共享交易過程中,存在被第三方復制、留存、轉賣等風險,數據資產權益無法得到保障,數據共享可能就是在為他人做嫁衣,因此,不敢把數據拿出來共享交易。
1數據具有特殊性
通常的商品,不管是實物商品還是虛擬物品,都有一個明確的所有權約束,獲得所有權,就能唯一擁有商品,享用商品帶來的價值。商品交易和交換是商品所有權的轉移過程,在所有權轉移之前,任何一方觀看、托管甚至試用都不會真正擁有商品,這些過程也不會對商品提供者造成實質性利益損害。
相對于普通商品,數據具有其特殊性。
1)無唯一性,沒有明確的所有權約束。普通商品具有唯一性,同一時間只能有一個所有者,所有權與唯一性是相關聯的。數據商品不具備唯一性,可以同時交易給多個對象,也就沒有了傳統所有權的概念。
2)看過即擁有。傳統商品的所有權都有一個顯式的、公認的證明,比如房產證、股票賬戶,交易的安全就是順利保障所有權的轉移。數據商品沒有了傳統所有權的概念,擁有數據商品也更為簡單,成本更低,看過即擁有了數據商品,就能獲得效用。
3)數據復制的完全無差異性。普通商品也存在復制和盜版,但復制品和盜版在效用上是與原商品有著巨大差別的,比如仿制的汽車不如原廠汽車質量好,復印的畫不如原版畫價值高等,而數據產品的復制具有完全無差異性,在效用上也沒有差異。
推薦閱讀:區塊鏈論文怎么投稿sci期刊
2傳統數據交易模式無法保障交易方的安全和權益
2.1托管交易模式
各個業務機構將自身數據托管到中心數據庫,由中心數據與外部進行數據交易。如圖1所示。
數據機構托管數據后,數據完全由數據中心所有,數據的后續應用都與機構無關,比如交易的數量、交易的對象等等,權益完全依賴中心的誠信度。
2.2聚合交易模式
數據聚合中心通過API接口將數據業務機構鏈接起來,業務機構無需事先將數據上報給中心,數據由機構自己管理。當某個主體需要查詢數據時,通過中心與數據機構實時交互,有數據的機構回應信息,由中心統一返回給查詢機構。如圖2所示。
、贆C構1發起“我要查小明”的請求,發送到數據聚合中心。
、跀祿酆现行膶⒄埱蟀l送給除機構1以外的所有機構。
、塾袛祿臋C構4和機構6回應,將數據發送給聚合中心。
④分發中心將機構4和機構6回應的數據匯總后發送給機構1。
聚合的模式表面看起來數據都由數據機構各自控制,中心只是起到了鏈接和撮合交易的功能,但仔細分析數據流動機制,就會發現聚合模式的中心其實有能力、也有機會留存交易數據,也就擁有了數據,隨著交易的不斷進行,數據不斷積累,聚合中心逐步變成了托管中心。
2.3小結
數據作為特殊商品具有獨特性,按照商品流通中介模式建立的數據中介平臺構成了對數據交易雙方權益的潛在威脅,變成了數據交易的一個障礙。
交易平臺往往都是把自身作為權威、可信的第三方,表明自己不愿也沒有動力去留存數據。但無法做和不愿做是兩個概念,無法做是想做但做不到,不愿做是有能力做但沒去做,一個不具威脅,一個具有潛在的威脅。
只有建立符合數據特性的信息平臺,通過技術機制而不是僅憑承諾來保障數據的安全和權益,做到讓數據交易雙方真正放心,才能加速數據的順暢流動。
3基于密碼和區塊鏈技術的數據交易平臺
3.1設計目標
設計一種新型的數據交易平臺,從技術上保證平臺只能做鏈接功能,沒有機會查看、復制、留存交易數據內容,保障數據的隱私和安全,讓交易雙方放心。
放心的平臺,要做到以下兩點。
1)對數據購買者放心。數據產品合法化,規范化,可預期;交易要保密,信息查詢或者購買行為本身就是隱私,不能被廣播、被無關機構獲知,僅數據提供方知曉;交易要精準,一旦發起交易,必定成功;交易有保障,交易行為有記錄,可查詢,可申訴。
2)對數據提供者放心。數據由提供者存儲和管理,誰的數據誰控制;交易過程中,數據僅能被購買者獲得,其他任何第三方,包括平臺,也無法獲取數據;數據購買者無法在平臺上將購買的數據再次交易;購買者的購買意圖會準確傳達,不會被平臺過濾和轉向;交易有保障,交易行為有記錄、可查詢、可申訴。
3.2設計原則
3.2.1正確使用密碼技術
一個系統不是用了密碼技術就代表了安全,更重要的是能否正確使用密碼技術,密碼技術的正確使用包括兩個方面。
1)密碼算法的正確使用。單獨一種密碼算法很難有效保證整個系統甚至某個應用功能的安全性,需要對多種算法進行有效組合,比如身份確認可以使用非對稱加密,不可逆可以采用HASH算法,大數據量加密采用對稱加密,不可抵賴和篡改使用數字簽名,定向加密采用數字信封等等。即使使用密碼,不合理的組合也會導致漏洞。
2)流程的正確使用。保證整個業務的安全完成必須在各個流程中正確使用加密技術,在數據共享流程中,至少要包括密文索引、密碼查詢、密文獲取。
正確加密技術的使用目標是每一筆交易都能保證隱私,同時,不可抵賴,都可以追蹤,第三方無法獲取數據內容。
3.2.2引入區塊鏈技術
區塊鏈是一種共享的分布式數據庫技術[1],具備共識的四個特性:去中心化(Decentralized)、去信任(Trustless)、集體維護(Collectivelymaintain)、可靠數據庫(ReliableDatabase)[2]。簡單可以把區塊鏈理解為是一種完整的、不可篡改的、多方參與和監督的記錄方式。
區塊鏈是比特幣的底層技術支撐,以比特幣為代表的數字貨幣,關鍵的創新是通過具有時間戳(Timestamp)的哈希鏈和工作量證明(ProofofWork)機制解決雙重支付(DoubleSpending)和拜占庭將軍問題(ByzantineGenerals’Problem),即保證同一筆比特幣不會同時出現在兩個地址[3],并且在信道可靠的基礎上,所有節點都可以讓其它節點接收到自己的真實意圖,并最終一致行動[4]。
這一技術方案最早見于化名為中本聰(SatoshiNakamoto)的個人或團體在2008年發表的論文Bitcoin:APeer-to-PeerElectronicCashSystem[5],如圖3所示。
區塊鏈技術和思想的引入,可以讓所有機構公平參與,中心平臺的操作也變為透明和可監督,成為隨時可監督、可拋棄、可替換的服務者,每個參與者也可自成中心,讓原來的強中心變成弱中心。
3.2.3開放與開源
無論多么完善、多么強大的機制和體系,都擋不住實現過程中的小“技巧”(漏洞或者后門)。表面上說的再好,最后的實現是黑盒,還是無法讓參與者放心,為了讓參與者徹底放心,系統需要協議開放和代碼開源,而開放和開源也是區塊鏈的特性所要求的[2]。
1)協議開放。系統對交互的協議和數據格式公開,參與者可以自行技術實現相關組件加入體系,確保自身數據的安全可控。
2)代碼開源。系統為參與者寫好了數據接入模塊,源代碼公開,讓用戶看的清清楚楚,也證明系統的清白。敢于協議開放和代碼開源,本身就是系統透明、安全以及公正的最好證明。
3.3平臺設計
3.3.1整體架構
整個體系由三部分組成,如圖4所示。
1)公共區(交易平臺)。第三方機構建設運營,主要作用是搭建基礎通訊架構,實現成員之間的連接和通訊隱藏;成員認證和接入管理;維護公共記錄塊鏈,實現對數據的索引記錄、交易記錄;制定數據規范和交易規則,維持交易秩序;協助交易方完成數據的追溯維權。
2)成員區。參與方數據區,主要保存公共區記錄塊鏈的備份,監督公共區的區塊鏈記錄的正確性;維護自己可共享的隱私數據,提供對外的查詢服務;發起查詢,獲取外部數據。
3)節點設備。連接公共區和成員區,實現從公共區域中備份記錄塊鏈,完成自有數據的塊鏈生成和提交,接收來自公共區域的消息,實現與對端的安全通訊(查詢及被查詢)?梢杂沙蓡T根據開放協議自行開發實現,也可以由交易平臺提供源代碼。·
3.3.2體系初始化
第三方搭建交易平臺服務系統,對外公布交易平臺的自簽名證書(公鑰)。交易平臺公布運營規則,成員加入資格,共享數據格式標準。如下為用戶的信貸信息共享數據標準(邏輯組成示例)。
1)用戶:C3765DF5C2AAC29642EC08F9CDC148B03E2727D7[(身份證+姓名)HASH值]。
2)近兩年貸款信息,如表1所示。
4)正在進行的貸款,如表3所示。
3.3.3成員加入及認證
1)成員申請加入,交易平臺審核確認成員身份,允許成員加入后,成員向交易平臺發送第三方CA發放的數字證書或者自產生的數字證書,作為成員的身份證書,交易平臺將此數字證書與成員真實身份對應。
2)成員自己生成任意數量公私鑰對池,將公鑰池數據用身份證書的私鑰進行簽名,發送給交易平臺,交易平臺使用成員身份證書進行驗證后,將公鑰池中的公鑰與成員關聯,也作為成員的身份標識(此步驟可以在步驟1完成后,根據需要隨時發起,可多次發起)。
使用多個公鑰的目的是成員可以使用多個身份標識發布數據索引,讓其他成員無法判斷數據的來源。
如果使用實名交易,則無需多個公鑰。
3.3.4數據索引提交
1)成員選擇可以對外共享或者交易的數據。
2)計算主體標識ID(如:身份證+姓名)的HASH值,提取主體信息描述,計算主體信息內容的HSAH值,并為此信息定價,形成基礎數據索引信
3)從公鑰池中選取此次共享數據采用的密鑰對(同一主體記錄應保持使用同一密鑰),在信息中增加公鑰信息,并使用對應的私鑰對信息進行簽名,形成記錄申請包,發送給平臺。申請包如圖5所示。當數據有更新時,成員應重新提交數據索引及描述。
3.3.5共享數據索引區塊鏈生成
交易平臺收到記錄申請包,提取相應的公鑰,驗證公鑰是否在已經提交的公鑰池中,確認此公鑰為有效成員所擁有,然后使用公鑰對記錄簽名進行驗證,確認此信息為對應成員所發送。然后提取申請中的密文索引信息作為一個記錄(Record)。平臺將收到的所有成員發送的記錄匯總,加入到當前區塊(Block)中,并且與前期生成的塊鏈接形成鏈條(Chain)。
Block的生成引入隨機競爭分配機制,使得每個參與者節點都能公平獲得生成Block的機會,從而保證每個節點的信息都能被記錄在鏈條中,也保證了鏈條參與節點共同維護。使用隨機競爭分配機制而不是比特幣中的工作量證明挖礦機制,可以大大減少能源的損耗。2014年6月曾有工程師系統計算,在比特幣全網計算能力為110000000GH/S的情況下,整個網絡的挖礦成本約為每年8億美元,包括電力成本約7071.2萬美元和礦機投資約7.33億美元[6]。如圖6所示。
交易平臺定期(如每小時)將各個成員提交的新索引和更新索引匯總生成當天的塊,加入鏈條中。鏈里的記錄內容無法更改和刪除,只能新增記錄。
每個成員都可以對索引鏈進行下載和檢索,確認自己提供的索引是否在索引鏈中,形成對交易平臺的監督。
3.3.6信息查詢
當成員需要查詢平臺中是否存在某個主體信息時,首先是檢索平臺中是否存在對應的索引。查詢成員獲取到主體的身份信息(如身份證+姓名),對身份信息進行HASH處理,得到身份信息密文,如C3765DF5C2AAC29642EC08F9CDC148B03E2727D7,使用密文進行檢索,檢索可以通過兩種方式。
1)將密文索引值發送到交易平臺,由返回查詢結果。
2)從交易平臺中下載索引的區塊鏈文件,自行解析其中的密文索引,檢索是否存在需要查詢的主體索引。
無論交易平臺服務檢索,還是本地自行檢索,僅僅是查詢平臺中是否有機構提供此主體的信息,并不返回真正的數據內容。如果存在,則可以得到此索引對應的完整索引記錄,包括密文索引ID、描述、服務地址、價格,提供機構的密鑰及簽名等信息。
SCISSCIAHCI