發布時間:2021-03-02所屬分類:管理論文瀏覽:1次
摘 要: 摘要:近年來,檔案數據管理成為檔案學研究中的一個新的關注點。本文從檔案數據管理的內涵與對象、面臨的困境、應對措施三方面對我國檔案數據管理的研究成果進行評述,認為未來我國檔案數據管理研究內容中需要關注以下幾個問題:檔案數據管理向檔案數據治理
摘要:近年來,檔案數據管理成為檔案學研究中的一個新的關注點。本文從檔案數據管理的內涵與對象、面臨的困境、應對措施三方面對我國檔案數據管理的研究成果進行評述,認為未來我國檔案數據管理研究內容中需要關注以下幾個問題:檔案數據管理向檔案數據治理的轉變、檔案數據化的技術體系與推進策略以及檔案數據開放相關問題。同時在研究方法上注重多學科視角與跨領域合作。
關鍵詞:檔案數據;檔案數據管理;數據管理
檔案數據管理問題從20世紀90年代起就受到我國學者的關注,馮惠玲教授率先使用檔案數據一詞,探討了檔案計算機檢索的數據準備問題。[1]此時,檔案數據僅僅指代的是與檔案相關的元數據。近年來,隨著大數據浪潮下的新一代信息技術在檔案工作前端與后端的同時發力,檔案數據逐漸成為檔案管理的新對象,檔案數據也不再被認為是與檔案相關的元數據,而是既包括元數據又包括內容數據的大規模檔案數據。數據管理、數據治理等領域的研究成果開始滲透到檔案管理當中,如何管理檔案數據成為檔案學研究當中的新問題。經文獻調研,已有2篇相關綜述,但其強調的是不同階段檔案數據的概念與檔案數據治理的概念問題。為反映近年的研究關注熱點,本文以相關文獻較多且具有代表性的CNKI數據庫收錄的與檔案數據管理相關的研究成果為基礎,通過系統地整理和綜述,揭示近十年來檔案數據管理的研究進展,并對該問題提出研究展望,以期能夠為后續研究提供參考。
1數據來源及統計結果
1.1數據來源
2011-2012年“大數據”概念的引入,使得我國檔案數據管理研究內容產生了巨大改變。為了解近十年的檔案數據管理研究現狀,筆者以中國知網期刊全文數據庫為文獻來源,以主題為“檔案數據”AND“管理”,檢索年限為2011年—2020年,將期刊來源限定為北大核心與CSSCI,剔除不相關文獻,同時補充“檔案數據”AND“治理”等相關內容,最終選取180篇相關文獻作為研究樣本。
1.2統計結果
筆者借助Excel、EndNote以及SATI分析軟件,通過定量分析與定性分析來對研究樣本進行處理,從發文量、核心機構、核心作者、發文期刊四個角度來分析我國檔案數據管理的研究現狀。
1.2.1年度發文量
2011——2020年年度發文量見下表:
年度發文量往往體現一個領域對研究問題的關注程度。表1為篩選后的180篇相關文獻年度分布情況,對2011-2020年關于檔案數據管理的期刊年度發文量進行統計,得出此主題相關文獻整體呈現迅速增長的態勢,并在2020年達到31篇。就文獻研究增長趨勢看,此問題仍然有較大的發展空間與研究關注度。
1.2.2主要發文機構
2011——2020年主要發文機構見下表:
主要發文機構往往體現關注研究問題的單位分布情況。通過總結分析,從表2能夠看出對檔案數據管理問題關注的核心機構主要包括高校與國家檔案機構兩個群體。其中高校以上海大學圖書情報檔案系、中國人民大學信息資源管理學院為核心研究單位,檔案機構中國家檔案局、廣東省國土資源檔案館、浙江省檔案局、江蘇省檔案館都對檔案數據管理問題關注度較高。
1.2.3主要發文作者
2011——2020年主要發文作者見下表:
主要發文作者往往表現對研究問題關注度較高的學者分布情況。目前關注檔案數據管理問題的作者呈現分散分布狀態,其中發文量最多的是于英香學者與金波學者。劉永學者、周林興學者等,多位學者都對此問題有研究。
1.2.4主要發文期刊
2011——2020年主要發文期刊見下表:
高頻文獻來源期刊能夠體現關注此研究問題的期刊分布情況。筆者總結發現,對檔案數據管理問題關注度較高的期刊皆為檔案學領域期刊,其中《蘭臺世界》發文量最高,《中國檔案》、《浙江檔案》、《檔案學研究》等期刊也刊登多篇相關文獻,表明檔案學領域整體對檔案數據管理研究表現出高關注的現狀。
由于檔案數據管理研究處于尚處于初步發展階段,在現有研究成果中檔案數據管理與檔案數據治理的研究內容多有交叉,本文統一用“管理”一詞表達。文章采用定性分析將主題框架分為三個部分,一是檔案數據管理相關概念的解讀與辨析,主要包含檔案數據概念、檔案數據管理模式、檔案數據管理工作對象。二是檔案數據管理工作面臨的困境,從管理思維、管理權限、管理能力三個層面進行分析。三是對已有文獻對檔案數據管理工作困境提出的解決對策進行總結歸納。
2關于檔案數據管理相關概念的辨析
2.1關于檔案數據概念的辨析
不同的學者對作為檔案數據管理對象的“檔案數據”的理解不盡一致。有學者從計算機存儲的視角出發,認為凡是存儲在計算機及相關存儲設施當中的數字檔案以及元數據都是檔案數據。國家檔案局發布的《基于文檔型非關系型數據庫的檔案數據存儲規范》指出檔案數據包括電子檔案的內容數據、傳統載體檔案數字化副本的內容數據以及兩者的元數據(含目錄數據);有學者認為檔案數據除了包括數字檔案,還包括與之相關的管理類數據。金波學者等人認為檔案數據包括業務活動過程中形成的數據,管理及利用過程中工作人員與用戶產生的數據[2][3];有學者認為新興的具有檔案屬性的數據是檔案數據。甚至有人說大數據是檔案數據,有學者依據德里達與弗洛伊德的哲學認識,推知大數據都是檔案[4]。網站數據、社交媒體數據、個人日志等網絡數據也逐漸被納入檔案數據的范疇[5];還有學者指出,經過數據化處理后形成的數據態的檔案稱為檔案數據。數據化后的檔案資源才能進行下一步的檔案數據利用[6]。錢毅學者提出部分行業文檔管理已經呈現出數據態內容,需要關注數據本體、流程等問題[7]。對數據顆粒單元的檔案管理,需要將檔案數據化納入企業信息化發展規劃與績效考核。[8]
相關知識推薦:天津市檔案職稱晉升政策
筆者認為,檔案數據存在廣義與狹義的區分,廣義的檔案數據認為所有系統中生成的具有檔案屬性的數據都應納入檔案數據管理范疇;狹義的檔案數據指的是檔案機構保存的數據資源及在管理過程中生成的有保存價值的管理數據。本文所討論的檔案數據處于狹義范圍。
2.2關于檔案數據管理模式的辨析
大數據浪潮推動檔案行業開始探索檔案數據管理這一問題,縱觀學界對這一概念的研究,其內涵可以解釋為:“檔案數據+數據管理”與“檔案+數據管理”兩種模式。第一種模式“檔案數據+數據管理”,指的是運用數據管理的方法對檔案工作中的數據資源進行管理。于英香等學者將檔案數據管理解構為:檔案數據管理=檔案數據+數據管理,指的是在數據管理范疇管理檔案數據[9][10];劉越男學者認為檔案也是一類數據,檔案管理是數據管理的組成部分[11];謝國強學者等則認為數據屬于檔案,應將數據納入檔案管理范疇。[12]可見,對于檔案數據管理當中檔案與數據的關系檔案界還存在分歧。第二種模式“檔案+數據管理”是指檔案部門參與數據管理,與數據管理部門協同治理大數據[13]。劉越男學者提出檔案機構對業務上的文檔和內容進行管理,與其他機構數據管理活動相輔相成,直接或間接的參與數據管理[14]?梢钥闯鰞煞N界定認為的管理對象存在著本質的不同。
筆者認為檔案數據管理應該強調檔案機構借助數據管理的方法與技術,在其管理范圍內對檔案數據資源進行管理。
2.3關于檔案數據管理工作對象的劃分
由于對于檔案數據的不同理解,因此當前學界對于檔案數據管理對象的認識也是五花八門。一是認為檔案數據管理的對象源自檔案館內的原有數據以及生成的管理數據。例如周楓等學者就認為檔案數據管理對象主要是檔案館藏資源、管理數據、利用數據[15];也有學者將檔案數據分類為檔案目錄信息資源、檔案內容信息資源、多媒體信息資源、應用信息資源、檔案館庫信息資源[16]。二是認為檔案數據管理的對象包括檔案館存儲資源之外的大數據資源。例如有學者提出尚未納入檔案部門保管的數據,如政府公開數據、檔案用戶數據,甚至新型數據資源,感知數據、社交媒體交互數據等也是檔案數據的來源[17]。筆者認為檔案數據管理工作的對象首先應該在檔案館內,是從業務部門移交到檔案館內的數據資源。其次檔案部門需要對業務部門的檔案數據資源進行前端控制,提供管理支持,如數據格式、數據存儲系統、數據內容的規范,以便后續對數據收集、保存、利用工作的開展。
綜上,學界對于檔案數據管理的相關概念并未達成統一,也缺乏對檔案數據管理工作的系統解讀。主要表現為:一是對檔案數據的定義不明確,對于檔案數據工作的對象與來源存在不同的認知,是否包括檔案機構外部生成的大數據資源是主要矛盾。二是對數據管理與檔案管理的關系解讀存在分歧,到底是運用數據管理手段開展檔案工作,還是檔案部門參與數據管理工作,需要進一步的明晰。筆者認為,檔案數據應當首先符合檔案的基本屬性,其次該檔案是數據格式的檔案。檔案數據管理工作的對象應是在檔案館內部對數據格式的檔案資源進行管理。
3檔案數據管理工作面臨的困境
檔案數據管理工作處于起步階段,多數機構的數字檔案館僅限于對半結構化成果(如PDF、圖片等)進行管理,對于結構化的數據管理,在實際工作中仍有較大難度。通過對文獻進行梳理,得出此困境的形成因素主要分布在檔案機構舊有實踐中思維的固化,數據浪潮帶來的管理對象復雜化導致管理職能與權限的不明確,傳統技術難以滿足新的工作需求。
3.1管理思維固化
數據管理處于萌芽階段,面對檔案數據管理的轉型,檔案機構在思維上存在傳統固化現象。對于檔案管理對象,仍局限于傳統的紙質檔案管理;對于檔案存儲保管,存在管理思維上重數量、輕質量的傾向;對于檔案開放,存在因害怕承擔信息泄露、篡改等安全隱患的風險,而持有“不愿共享、不敢共享、不能共享”的心理[18]。這些固化的傳統檔案管理思維形成檔案數據的存儲保管、以及價值發揮工作的阻礙。
3.2管理權限模糊
由于對檔案數據來源的不確定,其中認為包含政府數據、多媒體等大數據的劃分方式,導致在檔案數據管理職能劃分上產生爭議。由于檔案部門自身管理權限的不明晰,使得具體職能未得到明確,導致檔案部門與數據管理部門在管理對象上存在交叉,尤其在政務信息資源歸檔和開放等方面的職責劃分不明[19]。在浙江省“最多跑一次”改革中,檔案部門與業務部門在業務檔案管理問題上權限不明,導致在實際檔案收集工作難以開展[20]。面對數據管理大環境,檔案部門還未加入已有43個國家部門和單位參與的促進大數據發展部際聯系會議,表明檔案部門已經在一定程度上失去對數據管理的話語權,無疑會影響到日后檔案部門數據管理職能的發揮。
3.3管理能力局限
檔案機構在開展檔案數據管理工作時主要存在兩方面的能力局限。一是技術方面。由于實踐部門對檔案數據深度分析能力尚淺,檔案數據生態系統不健全,面對檔案數據存量多、增長快、類型繁多、結構復雜的情況,傳統的數據庫不足以處理TB級別的數據,無法提供有力的解決措施[21]。對于防范檔案信息的丟失、泄露等檔案數據安全管理問題,更是存在技術上的缺陷。二是數據孤島、數據難共享問題。在檔案部門,沒有標準統一的規范來管理不同全宗的不同系統中形成的不同格式的檔案數據,導致檔案數據資源的格式與內容存在差異。目前檔案數據開放共享僅限于部分檔案目錄層級的開放共享,全內容數據的共享仍難以實現[22]。除此以外,在企業檔案數據管理中信息孤島現象也大量存在,數據標準不統一、數據質量差都是阻礙檔案數據共享的重要因素[23]。
概言之,檔案數據管理工作目前的困境分為兩個方面,一是檔案機構內部的管理思維與管理能力的局限。筆者認為,需考慮各級檔案館的現有數字檔案館建設水平,結合具體情況分析困境,不可采取“一刀切”的判斷方式,應將不同檔案館的困境進行分類總結,再來尋找應對措施。二是檔案機構與外部其他數據管理機構的權責不明確。筆者認為,面對數據資源的管理權限問題,檔案機構不能急于全包全攬,而是明確與其他機構在實際工作中的矛盾,針對矛盾來劃清權限,明確管理范圍。——論文作者:何玲邢琳悅
SCISSCIAHCI