學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于大數據共享環境下圖書館“區塊鏈”技術應用研究

發布時間:2020-03-04所屬分類:科技論文瀏覽:1

摘 要: 〔摘 要〕 [目的] 圖書館作為公共產品其本質屬性就是服務用戶, 而提高服務質量是圖書館追求的第一目標。 在大數據時代, 圖書館只有掌握最先進的技術才能真正實現這一目標。 [方法] 大數據技術解決了圖書館信息服務的針對性、 有效性問題, 而 區塊鏈 技術

  〔摘 要〕 [目的] 圖書館作為公共產品其本質屬性就是服務用戶, 而提高服務質量是圖書館追求的第一目標。 在大數據時代, 圖書館只有掌握最先進的技術才能真正實現這一目標。 [方法] 大數據技術解決了圖書館信息服務的針對性、 有效性問題, 而 “區塊鏈” 技術解決了圖書館信息收集多樣性、 存儲的安全性和傳播的廣泛性, 可以說它給圖書館服務帶來革命性的變革。 [結果] “區塊鏈” 技術使圖書館信息服務真正成為多中心、 安全存儲和高效率的信息中心, 解決了傳統圖書館技術中無法解決的一些難題。

基于大數據共享環境下圖書館“區塊鏈”技術應用研究

  〔關鍵詞〕 大數據; 圖書館; 用戶服務; 信息; 收集; 區塊鏈

  2016 年被稱為 “區塊鏈” 元年, 面對這一有可能帶來顛覆性的新技術, 我國工信部等國家部委以及各省市給予了高度重視。 2016 年 10 月, 工信部信息化和軟件服務業司指導編寫了 《中國區塊鏈技術和應用發展的白皮書》,對區塊鏈技術的發展提供政策支持; 2016 年底, 貴州省發布了 《貴陽區塊鏈發展和應用》 白皮書。 同時, 各地通過成立聯盟 (中關村區塊鏈產業聯盟) 和研究機構 (青島區塊鏈研究院) 等方式大力推進其發展和應用[1]。 “區塊鏈” 技術發展至今應用的領域越來越豐富, 從金融保險到跨境貿易, 從文娛版權到存證溯源, 而且 “區塊鏈” 技術與大數據、 人工智能技術逐漸結合, 衍生出越來越多的應用領域。

  1 區塊鏈技術與圖書館服務

  2017 年 9 月, 國內第一家 “區塊鏈” 主題圖書館在深圳前海蛇口自貿片區揭牌。 雖然這是一則普通的新聞報道,但其背后的含義是一種新的圖書館業態的誕生, 同時也標志著圖書館信息服務一場革命性的變革從此拉開了序幕。據金色財經報道, 早在 20 世紀 90 年代中期, 美國圖書館服務研究所就成立了 “區塊鏈” 技術運用于圖書館的數字管理中心。 基于區塊鏈技術的公共圖書館系統試點, 解決圖書館和檔案領域面臨的挑戰, 并且有可能利用新的工具、研究成果、 模型、 服務或聯盟來推進圖書館和檔案實踐(金色財經 2017 年 9 月 5 日訊)。 基于大數據共享環境下圖書館 “區塊鏈” 技術應用研究日益為圖書館服務的提升帶來無限空間。 眾所周知, 圖書館作為公共產品其本質屬性就是服務用戶, 而提高服務質量是圖書館追求的第一目標。在科技無限發達的今天, 大數據服務即是其服務的重要基礎、 抓手和共享紐帶, 也是圖書館高質量服務的必然選擇和途徑。 因為, 只有在大量數據分析的環境下才能研究用戶區分用戶, 充分滿足用戶的多樣化需求, 細致到一個國家、 一個地區、 一個群體、 一類用戶, 甚至是針對某個用戶的真實需求進行超前預期判斷。 只有這樣工作才談得上 “用戶第一”、 “用戶至上”, 才能充分實現印度圖書館學大師阮岡納贊在其著名的 《 圖書館學五定律》 中提出的: “圖書館是一個不斷生長著的有機體”。 “有機體” 代表的是圖書館本身, 是服務的基礎, 而 “不斷生長” 是圖書館對自身服務能力的無限追求和本領的不斷增強。 現代圖書館的服務方式主要表現在如何把館藏資源、 館員、 服務、技術和用戶這五個要素的有機體最大效率地組織在一起。圖書館界常常在思考這樣一個問題: “有沒有一條主線把這五個要素圓滿地有機地串聯在一起”, 形成一個能使服務發揮最大能量的最佳鏈條, 把圖書館服務能量與讀者需求能量最大效率地結合與匹配。 以克服館藏資源不足、 館員素質不高、 服務質量不優、 技術手段落后的問題, 以及用戶需求最大限度滿足和積極引導的問題, “大數據” 技術的出現圓滿地解決和回答了這一問題。 因為, 隨著用戶閱讀需求日趨多元化、 個性化, 圖書館要想滿足讀者深度閱讀、 深度研究及其多樣的需求, 必須在技術服務層面上推陳出新, 在高度上深度挖掘。 可以說圖書館因科技發展而騰飛, 二者是密不可分的。 因為在大數據時代, 讀者與圖書館發生的一切關系中, 哪怕是一個及其細小的動作,都會產生一系列電子地圖和電子軌跡, 讓圖書館研究每個用戶、 每個用戶群體的各種借閱習慣和學習需求成為了可能, 使圖書館在為用戶的服務關系中, 始終處于一個掌握主動并且能夠主動出擊的地位, 可以說是 “利劍在手服務全有”, 圖書館用大數據服務用戶的時代已經開啟。

  既然大數據對于圖書館這么重要, 那么如何使信息收集更加準確、 存儲更加安全、 傳播更加有效就成為新的核心問題, 有沒有哪項技術可以滿足上述要求? 答案回答是肯定的, 就是 “區塊鏈” 技術。 這一技術最大的特點就是最終解決了圖書館信息鏈中所有的技術難題。

  1、 1 “去中心化”技術

  “去中心化” 技術是利用分布式核算和存儲, 不存在中心化的硬件或管理機構, 任意節點的權利和義務都是均等的, 系統中的數據塊由整個系統中具有維護功能的節點來共同維護, 使人人都成為信息的提供者, 解決了信息收集的多樣性問題。 這種技術方式大規模的使用, 使圖書館用戶對圖書館的依賴程度大大減少, 客觀上就迫使圖書館改變工作方式, 轉變工作重心。

  1、 2 分布式賬本不可更改技術

  分布式賬本不可更改技術證明, 一旦信息經過驗證并添加至區塊鏈, 就會永久地存儲起來, 除非能夠同時控制系統中超過 51%的節點, 否則單個節點上對數據庫的修改是無效的。 因此, 區塊鏈的數據穩定性和可靠性極高。 以其 “不可篡改、 不可抵賴” 等特點帶來了一種全新的信用模式, 解決了信息存儲安全性問題。

  1、 3 “開放和共識”技術

  “開放和共識” 技術解決了信息傳播的最大化問題,系統是開放的, 除了交易各方的私有信息被加密外, 區塊鏈的數據對所有人公開, 任何人都可以通過公開的接口查詢 “區塊鏈” 數據和開發的相關應用, 因此整個系統信息高度透明[2]。

  可以說 “區塊鏈” 技術與 “大數據” 技術的完美結合是圖書館起飛的無窮動力, 有了技術的飛躍發展才能有圖書館服務的巨大進步。 “區塊鏈” 技術的工作原理非常簡單, 但是理論非常深奧, 技術非常復雜, 它非常像我們平常召集人吃飯在微信上發信息接龍一樣。 第一, 人人都可以組織飯局, 信息的提供者來源非常廣泛; 第二, 人人都是監督者, 如果有人排序錯誤, 大家都會及時提醒; 第三,信息絕對安全, 因為沒有中心者, 信息完整存儲在每個人的手機上, 任何人都不能篡改; 第四, 傳播范圍廣、 傳播速度快, 傳播影響力大, 可以說有多少人就有多少個傳播者, 比傳統的傳播方式要提高千萬倍。 深圳前海第一家 “區塊鏈” 主題圖書館完美、 真實地把人們還處于想象中的學習關于 “區塊鏈” 知識層面的東西賦予實踐中, “區塊鏈” 技術解決了傳統圖書館技術中無法解決的一些痛點。 區塊鏈原本是比特幣等加密貨幣存儲數據的一種獨特方式, 是一種自引用的數據結構, 用來存儲大量交易信息,每條記錄從后向前有序鏈接起來, 實現了數據公開、 透明可追溯的產品的架構設計方法, 算作廣義的區塊鏈。 狹義的區塊鏈僅僅涉及到數據存儲技術, 數據庫或文件操作等,這與圖書館信息服務一脈相承。

  2 “區塊鏈”環境下圖書館重心的華麗轉身

  “區塊鏈” 技術使圖書館由信息的傳播者向組織者和管理者轉變。 信息的快速傳播是圖書館生存的根本屬性,是圖書館的壓艙石, 但是在圖書館服務質量提升過程中讀者詬病最多的就是信息更新慢, 數據信息慢、 圖書慢、 雜志慢、 服務態度也慢, 這也是許多讀者不愿意利用圖書館的一個重要原因。 而圖書館的公共屬性決定了它的關注度在于大多數讀者的廣泛需求上, 而對個性化多樣性需求很難滿足。 在大數據時代, 用戶的信息意識得到了極大的增強, 信息來源也越來越廣泛, 需求也越來越迫切。 以往那種單一信息源的時代已經落后, 需要有一個中心對所有信息進行高效處理, 多方組織, 深入管理。 這個中心無疑就應該是圖書館, 這是基于圖書館本身的巨大實力以及用戶的充分信賴這一公共屬性所決定的。 這中間必要的條件就是必須要有相關的技術和平臺, 以前之所以不成功的原因就是缺乏相關的技術手段。 今天 “區塊鏈” 技術使圖書館由信息的傳播者向信息的組織者和管理者的戰略布局轉移成為可能, 使圖書館的信息收集更加準確。

  2、1 區塊鏈“去中心化”技術使信息收集來源多樣化

  “去中心化” 就意味著 “多中心化”, 就信息而言恰好符合用戶的需求, 因為用戶對信息的多樣性需求是與生俱來的。 傳統圖書館基于公共屬性幾乎無法滿足用戶這一需求, 這幾乎涉及信息體制、 成本、 人員、 流程和共享體系。 “區塊鏈” 技術的多中心特征極大地滿足了用戶需求的多樣性、 復雜性和個性需求, 彌補了圖書館公共屬性中的缺憾。 而圖書館身份就是組織者和管理者, 要做的就是對信息進行打分和評級, 對外大力推介。 作法是可以把信息分成官方區、 自由討論區、 核實區等等。 “區塊鏈” 技術讓大數據真正安全傳遞起來。

  2、 2 區塊鏈“點對點傳輸”技術使信息準確率得到極大提升

  信息的準確率是其生命, 而信息的利用率是其 “活力”, 只有大力激活信息能量, 圖書館才談得上服務效率的提升。 傳統圖書館很難對館藏信息進行適當的篩選和甄別, 然后分門別類地提供給有需求的用戶。 一方面是大量信息的時滯; 另一方面是用戶尋求無門, 完全由用戶進行自我救贖, 信息利用效率大大降低。 圖書館只是成為了信息的搬運工, 而無附加值。 這一問題隨著大數據的應用有所緩解, 但是信息激活需要的 “點” 越大越好, 力度越大越好。 而 “區塊鏈” 技術中的點對點傳輸、 共識機制技術可以極大地把所有信息都公開呈現在用戶的面前, 極大地增強了傳播性, 進而極大地提高了利用率。 任何用戶都可以對所發布的信息進行評點和提出改正意見, 尤其是相關利益人, 在彼此討論中, 信息經過多層過濾往往最趨近真實。

  3 區塊鏈“不可篡改、 強背書、 全歷史”技術確保存儲安全性

  信息存儲安全是信息服務的根本保障, 也是核心的問題。 如果這一工作做不好一切都是無用功, 相反還會帶來巨大的災難, 尤其是館藏特色資源一旦被串改, 就會給歷史給社會帶來一系列不可估量的損失。 數字圖書館是用數字作為技術處理和存儲的方式, 對圖書館各種圖文資料進行存儲, 實質上就是一種多媒體制作的分布式信息存儲系統。 它把各種不同載體的資料、 不同地理位置的信息資源用數字技術存儲起來, 以便于所有跨越區域的用戶進行信息的網絡查詢和傳播。 數字圖書館業務涉及信息資源加工、存儲、 檢索、 傳輸和利用的全過程。 在新技術提高圖書館使用效率的同時, 也引入了大量的安全風險和隱患, 成為[WU1] 網絡攻擊者攻擊的目標, 可以說安全風險問題從有數據概念開始就一直伴隨其左右。 公共圖書館掌握著大量高密度、 高價值的數據, 尤其是用戶需求數據, 是其最獨特資源。 大數據開放是社會客觀要求和大勢所趨, 越開放其價值越大, 從而對整個經濟社會的前進和發展產生一系列推動力。 然而, 在大數據開放的模式下如何保護個人隱私和館藏資料數據成為主要難點和挑戰, 其次才是開放大數據服務。 區塊鏈技術是利用塊鏈式數據結構來驗證與存儲數據、 利用分布式節點共識算法來生成和更新數據,利用密碼學的方式保證數據傳輸和訪問的安全, 利用由自動化腳本代碼組成的智能合約來編程和操作數據的一種全新的分布式基礎架構與計算方式。 “區塊鏈” 技術中的數據脫敏技術極大地保證了數據的私密性。 其運行原理是根據密碼學原理 Hash ()函數的單向性: Hash (x)= y, 通過 y很難找到 x。 哈希鏈: 假如現在有順序產生的數據塊 A、B、 C。 那么我們可以這樣計算一個 Hash。 注意 “‖” 表示拼接 h0 =Hash (A); h1 = Hash(B | | h0); h2 = Hash(C | |h1), h2 是我們計算的 Hash 頭部, 之所以稱之為 Hash 鏈,因為 h2 的值依賴于之前一系列數據的內容和計算順序。 假如說現在你知道了 h2, 別人拿著 A、 B、 C, 他不管是修改A、 B、 C 的任一點內容還是 A、 B、 C 的出現順序, 你都無法再次計算出正確的 h2。 利用世界最先進的哈希處理技術等加密算法, 可以使數據進行脫敏處理, 比如基于 “區塊鏈” 技術的英格碼系統 (Enigma), 在不訪問原始數據情況下進行一系列數據運算, 可以對數據的私密性進行保護,杜絕數據共享中的信息安全問題, 從而避免了來自多個方面的漏洞對圖書館的威脅。

  .3、 1 “區塊鏈”技術使外界攻擊變得幾無可能

  “區塊鏈” 技術具有不可篡改、 強背書、 全歷史的數據庫存儲技術, 本質上就是一個去中心化的數據庫, 它利用一串使用密碼學方法相關聯產生的數據塊, 其中每一個數據塊中都包含了一次信息網絡交易數據, 用于驗證其信息的有效性和生成下一個區塊。 其中的原理是, 假如網絡中大家都默認遵守協議, 只在最長的哈希鏈后計算新的頭部, 那么一切都很好, 但是如果有人想篡改、 搞不一樣技術, 那他就得擁有更為強大的計算能力, 能夠計算出一個鏈條分叉, 或者說直接計算出一個新的鏈條, 讓大家都承認, 而這幾乎是不可能做到的事情。 至于這個難度的證明,中本聰就是建立了一個泊松分布的概率模型, 假設了誠實結點計算出新的哈希頭的概率 p 和不誠實結點計算出新的Hash 頭的概率 q 后, 算出了一個 N 值。 這個 N 值的含義是給出了當一個新的哈希頭部 h1 計算出來后, 其后追加 N個頭部(h2,h3,h4,…) 后, 網絡才應該承認這個新的頭部h1。 因為此時, 攻擊者要想成功發動攻擊, 至少需要計算出一個長度大于 N 的分支, 這個概率在攻擊者沒有掌握全網算力 50%的時候是很難達到的[3]。 它通過網絡中所有節點共同參與共同計算, 互相彼此驗證其信息的真偽以達成全網一致的共識, 可以說 “區塊鏈” 技術是一種特定的數據庫技術。 因為 “區塊鏈” 是一種按照時間順序將數據區塊以順序相連的方式組合成的一種鏈式數據結構, 并以密碼學方式保證的不可篡改和不可偽造的分布式賬本。 保證了 “區塊鏈” 數據難以篡改, 代表誠實節點的最長的鏈包含了最大的工作量, 如果想要對業已出現的區塊進行修改,攻擊者必須重新完成該區塊的工作量外加該區塊之后所有區塊的工作量, 并最終趕上和超越誠實節點的工作量。 工作量最多的鏈, 一定是數據最完整的鏈, 一定是代表了全網用戶利益的鏈[4]。 人們都說 “區塊鏈” 其實是一種去中心化的分布式記賬手法, 什么意思呢? 例如在影視劇中常常會出現這樣一些橋段: 某人貪贓枉法, 事情敗露后, 大家卻找不著那個關鍵證物———賬本, 因為賬本記錄了彼此交易的詳細信息, 于是大家根據各種線索去找賬本才能偵破此案。 而 “去中心化” 的意思就是根本不存在這個賬本的問題, 不是某個人或者某個中心化的主體來控制, 而是所有節點共同維護、 共同記賬, 任何單一節點都無法篡改它。 這條鏈上擁有永久和透明可查的交易記錄, 全球一本賬, 每個人都可以查找。 同時, 一旦記錄完成, 就會永遠存在并且無法更改, 這可以為圖書館信息的存儲保護提供最完美解決方案。 就拿圖書館大量存儲的文本資料來說,該技術有一大功能就是可以全程追溯, 從作品登上 “區塊鏈” 的那一天開始, 每一次翻拍、 改編, 均會被蓋上一個時間戳、 源頭的原創作者可以追溯, 在作者去世后 “區塊鏈” 也不會停止工作。 原則上, 只要互聯網繼續存在, “區塊鏈” 技術就會永遠存儲相關資料。 這一技術也可以在一定程度上改善一個大 IP 授權紊亂的現象, 畢竟, 這是一種共同記賬的模式, 單一節點不可隨意篡改, 每次篡改必須是這一鏈條上所有節點均同意才行, 用戶以后再也不會被無數翻拍亂花迷人眼了[5]。 第一, 它避免了安全漏洞頻發。 系統漏洞的頻發給業務系統的安全運行造成極大的威脅, 惡意入侵者可以利用此漏洞, 通過發起惡意掃描和遠程溢出等攻擊方式, 進入數字圖書館業務處理系統的后臺, 以獲取、 篡改甚至破壞敏感的數據手段來破壞整個網絡的正常運行。 香港公共圖書館 RFID 存在漏洞致使手機 1分鐘即可篡改借書 RFID (無線射頻辨識) 是現在常見的一種無線通信技術, 究其原因是圖書館安全識別系統沒有進行加密處理裝備, 因此, 用戶只要利用智能手機再配合一些應用程序, 即可輕易更改借書紀錄, 并將有關書籍資料帶離圖書館, 1 年的時間圖書館因遺失而注銷的資料總數為 926 項。 第二, 它避免了數據庫安全受到極大威脅。大數據是數字圖書館的生命, 準確而完整的數據庫是圖書館自動化管理的核心和開展工作的基本保證。 但是內部人員蓄意的侵犯或其他敵意的攻擊, 如一些心懷不滿的授權用戶可能基于某種目的蓄意破壞數據, 從而使數據庫中的部分數據出現丟失或數據更新不一致的情況。 因網絡安全問題導致數據丟失或信息被盜使圖書館大數據屢遭重大損失。 比如河南封丘圖書館網站未采取防范措施遭黑客篡改網頁, 經查封丘縣圖書館未采取防范計算機病毒和網絡攻擊、 網絡侵入等危害網絡安全行為的技術措施, 致使網站遭到攻擊。 第三, 它避免 Web 應用層攻擊。 攻擊者通常通過 SQL 注入、 跨站腳本等攻擊方式, 很容易獲取圖書館網站的管理權限, 進而篡改網頁代碼, 加入惡意網站連接或惡意程序, 造成極其惡劣的影響。 第四, 它避免拒絕服務攻擊。 拒絕服務攻擊造成數字圖書館業務中斷, 數字圖書館信息系統作為一個重要的業務信息平臺, 很容易受到攻擊者惡意的大流量拒絕服務攻擊。 由于拒絕服務攻擊具有發起簡單、 難于追查、 危害巨大三大特點, 具有非常大的破壞性, 很容易造成系統癱瘓, 無法提供服務。 第五, 它避免人為失誤及權限管理。 人為失誤及業務權限管理問題也是圖書館數據面臨的主要風險, 人為管理失誤包括弱口令, 不正確的共享、 應用系統的錯誤使用等問題。 權限管理問題包括內部人員對業務應用系統的越權訪問、 違規操作或者操作人員直接的錯誤輸入導致系統宕機等。

  3、 2 區塊鏈技術“永久存儲”屬性避免突發事件造成的巨大遺憾

  突發事件可以說是伴隨人類而生, 有人類就有一系列突發事件。 突發事件可被理解為突然發生的事情, 具有速度很快, 出乎意料, 難以應對, 必須采取非常規方法來處理, 不管怎么說突發事件都會給圖書館帶來巨大的無法彌補的損失。 圖書館作為重要的突發事件防范區域也是避免不了被毀壞的后果, 尤其是館藏特色資料, 其具有唯一性、不可復制性, 一旦毀壞不可重生, 這對圖書館和社會都是毀滅性的打擊。 1951 年 1 月 8 日, 青海省圖書館發生大火, 燒毀其全部館藏, 甚至包括罕見的用金粉寫成的 《甘珠爾大藏經》 108 部和價值連城的宋朝壁畫 36 幅。 還有1991 年 2 月 13 日, 福建省建筑?茖W校圖書館發生了人為縱火事件, 諸如此類的 “文明劫難” 并不罕見, 它帶來不可彌補的巨大損失, 尤其是一些彌足珍貴的絕版、 孤本、善本及古玩字畫, 一旦焚毀, 會造成歷史性的遺憾。 同時隨著這些珍貴資料母本的消失, 圖書館記錄這些資料的大數據也有可能消亡, 因為資料是孤本, 大數據在不共享的情況下也是孤本。 “區塊鏈” 技術具有分布式數據存儲特點, 可以極大地避免以上問題的出現, 它可以完整保存關于孤本的所有大數據。

  相關期刊推薦:《現代情報》雜志是由中國科技情報學會主管,吉林省科技信息研究所主辦,全國公開發行的大型軟科學綜合性期刊,是集情報科學理論與情報實踐研究及圖書館學研究于一體的學術陣地。主要欄目有:理論探索、方法研究、應用研究、業務研究、技術視角、管理論壇、國外動態、綜述與述評等。歡迎社會各界專家、學者及廣大圖書情報工作者踴躍撰文賜稿。

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频