發布時間:2021-02-27所屬分類:教育論文瀏覽:1次
摘 要: 摘要:[目的/意義]圖書館學發展的數據化勢不可擋,探索、發現、掌握和適應其中規律將對圖書館學基礎理論研究產生重要影響。[方法/過程]本文使用CiteSpace工具,以近五年國內圖書館學關于數據的文獻為研究對象,得出圖書館學發展數據化的三個熱點研究領域。采
摘要:[目的/意義]圖書館學發展的數據化勢不可擋,探索、發現、掌握和適應其中規律將對圖書館學基礎理論研究產生重要影響。[方法/過程]本文使用CiteSpace工具,以近五年國內圖書館學關于數據的文獻為研究對象,得出圖書館學發展數據化的三個熱點研究領域。采用問卷調查和訪談的方法討論圖書館學發展數據化的趨勢、成因和策略。[結果/結論]圖書館學發展的確存在數據化趨勢并且集中在五個方面,呈現四個梯度。在此基礎上,發現圖書館信息資源深度開發的需要、量化研究方法對圖書館學研究的影響和圖書館學學科邊界的拓展是圖書館學發展數據化的重要成因,并提出應對策略。
關鍵詞:圖書館學數據化圖書館實踐圖書館學研究圖書館學教育
1研究緣起
發展趨勢是一個學科基礎理論研究的核心內容,圖書館學對發展趨勢的研究亦呈百舸爭流的態勢?缕絒1]認為新技術、應用研究和數字化研究將對圖書館學發展產生持續影響;馬海群[2]提出學科交叉、技術應用、深度需求是未來圖書館學科發展的重要作用因素;楊愛軍[3]建議我國圖書館學應當注重層次化發展。除此之外,數據化成為圖書館學發展的新動向,圖書館學發展是否會形成數據化的趨勢,將對圖書館學基礎理論的研究產生重要影響。
“數據化”(datafication)一詞是數據科學家維克托·邁爾-舍恩伯格(ViktorMayerSchonberger)和肯尼思·庫克耶(KennethCukier)提出的專業術語,描述了在網絡空間將社會行為轉化為在線量化數據的技術趨勢[4]。圖書情報與檔案管理學科領域關于數據化的觀點主要集中在信息資源利用方式的變化,例如檔案數據化是將數字檔案資源轉換為可供閱讀、分析和處理的檔案數據資源的過程[5];歷史文獻數據化是將文獻轉化為可量化分析的數據[6]?紤]到一個學科的數據化除了研究客體,還需要包括研究方法,筆者認為圖書館學的數據化是圖書館學領域將數據作為研究客體或研究工具的狀況或現象,圖書館工作或圖書館學研究中挖掘數據、統計數據和分析數據等都是圖書館學數據化的具體表現。
需要說明的是,數據化與數字化、知識化既有區別也緊密相連。數字化為數據化奠定了基礎,改變了信息的載體形式;知識化是對信息內容進行學習與創新的過程。數字化和知識化本質上都是對數據的加工處理,這與數據化是一致的。數據時代推進了圖書館學發展的數據化,探索、發現、掌握和適應圖書館學的數據化趨勢是圖書館人的任務與擔當。
2研究現狀
2.1數據來源與分析工具
由于目前關于圖書館學的數據化尚未有明確的定義,且根據CNKI期刊數據庫檢索發現關于圖書館學數據化的研究較少,為了提高查全率,本文以CNKI期刊數據庫為數據來源,將“篇名”檢索詞設置為“數據”,將檢索時間設置在2015—2020年,限定文獻分類為“圖書館學、圖書館事業”進行檢索,將檢索結果按照相關性排序,除去會議通知、征稿通知等與研究內容無關的題錄,最終得到有效文獻題錄2057條。借助可視化軟件CiteSpace,采用高頻關鍵詞的共現分析、聚類分析挖掘圖書館學關于數據的研究中包含的隱性知識,探索圖書館學關于數據的研究熱點以及發展現狀。
2.2文獻數量與研究熱點
文獻信息計量統計是科學基礎理論研究的一個重要環節,能夠一定程度上反映出某類研究在該學科領域的研究熱度。將圖書館學關于數據的研究進行信息計量統計,便于了解圖書館學發展數據化的基本情況。
圖1反映了2015—2020年圖書館學關于數據的研究文獻增長趨勢,2016年發文增長率最高,達到了30%,文獻數量在2019年達到峰值(2020年數據不完整,暫不做詳細分析)。圖譜方式可以直觀地反映關鍵詞之間的關系,如果某一關鍵詞或標題詞在其所屬領域反復出現,即為高頻次關鍵詞,可體現出該關鍵詞或標題詞所表征的研究主題是當前的研究熱點領域。圖2為關鍵詞知識圖譜,其中每個節點代表關鍵詞出現的頻次,節點越大代表相應的關鍵詞出現的越頻繁,反之,代表關鍵詞不經常出現。線表示節點之間的聯系,節點之間的連線越多代表節點間的聯系越緊密。
相關知識推薦:黑龍江省圖書館職稱晉升條件
下頁表1為檢出的2057篇文獻中頻次排名前十的關鍵詞,對其頻次進行求和,值為1286次,占文獻關鍵詞總頻次3216的46%。這些關鍵詞反映了該時間段我國圖書館學關于數據的研究熱點(高頻關鍵詞頻之和占全部關鍵詞總頻次的40%以上就能代表該領域的研究熱點[7)。]下頁表2為2057篇文獻中中心度排名前十的關鍵詞,能夠一定程度上反映出節點之間的聯系和某節點在整個網絡中的地位。結合圖2、表1和表2可以發現,所獲取的文獻中頻次最高的關鍵詞是大數據,頻次為580,其次是高校圖書館、圖書館、數據素養和關聯數據等;知識圖譜、機構知識庫、元數據和個性化服務等關鍵詞中心度較高,與其他關鍵詞的聯系較為緊密,這些關鍵詞反映了2015—2020年圖書館學關于數據的熱點研究。
2.3研究領域分析
研究熱點反映的是學者們研究內容的集中,進而形成熱點研究領域。近些年,大數據成為學術界的“新寵”,而大數據受到追捧的關鍵在于通過加工實現數據的“增值”。圖書館是大量數據的集中地,自然而然地成為數據化的陣地,關于元數據、知識圖譜和機構知識庫的研究也同樣是將數據作為研究客體或研究工具的表現。
2.3.1圖書館實踐數據化
對于研究熱點的把握和追蹤,有利于更加精準地分析與掌握圖書館學發展的趨勢。通過詞頻分析,大數據、高校圖書館、圖書館、數據素養、關聯數據等高頻關鍵詞,體現的是圖書館學關于數據的熱點研究。大數據環境下信息技術加速迭代,圖書館的館藏資源建設、館員業務能力以及讀者服務面臨轉型升級。王丹丹[8]提出應基于本地數據或多個機構的聯合數據來開展數據驅動的館藏建設;瞿浩[9]針對圖書館員數據管理的內涵、圖書館數據類型和圖書館員數據管理能力進行分析并提出相應的策略;羅鳳莉[10]認為運用圖書流通數據的關聯規則挖掘隱含關系,有利于調整館藏資源建設的學科結構、提升讀者服務的工作水平;曹嘉君等[11]構建了基于數據科學的知識創新服務模式。圖書館實踐的數據化為圖書館服務提供了新的途徑,加快了圖書館信息資源的更新與流通速度,提高了圖書館讀者服務的個性化水平,為信息傳遞提供了便捷的通道。圖書館實踐的數據化使得圖書館的服務模式突破時空限制,更有效地提升圖書館的數據管理水平。
2.3.2圖書館學研究數據化
圖書館學研究的數據化主要體現在圖書館學研究內容和研究方法的數據化。調查結果中的數據素養、數據關聯、科學數據和數據管理等高頻關鍵詞反映的是圖書館學研究內容的數據化拓展;知識圖譜、元數據、CiteSpace、語義網、數據挖掘等高中心度關鍵詞反映的是當前圖書館學研究的具體方法的數據化。趙蕊菡[12]發現大數據時代,圖書館學的研究內容從以文獻為主轉變為以數據為主,研究熱點轉向科研數據的發現、存儲、使用與分享和利用開放科學整合信息資源;張曉琳[13]認為數據范式將成為一種新型圖書館學研究范式;趙蓉英等[14]提出利用可視化分析技術對數據科學的發展進行分析,研尋數據科學的演進軌跡;劉丹[15]通過建立面向關聯數據的學位論文元數據語義化原型,評估語義網技術在學位論文元數據上的應用效果。數據化為圖書館學研究提供新課題,隨著大數據、數據科學、人工智能的發展,大量數據可以被廣泛使用,將數據轉換成有用的信息和知識是當務之急,科研數據和元數據逐漸成為圖書館學研究的數據基礎。
2.3.3圖書館學教育數據化
“iSchool運動”發展至今已在世界圖書館學和情報學領域產生了深遠的影響,關于圖書館學專業教育的研究顯示,數據素養是學者們重點關注的話題,也是本次檢出的高頻關鍵詞。司莉等[16]以38所iSchool院校的138個圖書情報專業研究生項目為樣本,通過調查發現此類院校的數據素養課程注重培養學生的數據挖掘能力,強調在實踐中培養數據意識與數據倫理;曹樹金等[17]認為未來可以在我國數據素養課程設計、數據素養能力模型的構建、數據素養能力評估體系、指標建設等方面進行更為深入地探索;安璐等[18]構建了數據挖掘課程的知識體系。結合國內圖書館學專業院校的課程設置,發現近些年許多院校增設了“大數據分析導論”“數據可視化”“數據結構”等課程。這是圖書館學教育受到數據化影響的表現,學者們對數據的關注逐漸滲透于專業教育之中,數據泛在的環境下,培養具備數據素養、數據挖掘和數據管理能力的圖書館學研究者和實踐者亦是發展復合型人才的要求。
3趨勢調查
為了探究圖書館學發展的數據化趨勢能否長足發展,本文編制了關于“圖書館學數據化發展專家態度調查”的問卷,設置了總加量表、累積量表和開放式填空問答,為確保調查的客觀性、全面性和合理性,筆者邀請了10位專家進行調查。受訪者年齡在35~50歲之間,包含2位研究館員,1位圖書館學期刊主編,7位從事圖書館學教育和研究的資深學者(來自北京大學、武漢大學、南京大學、中山大學和河北大學)。學者研究方向涉及圖書館學理論、圖書館管理、數字圖書館、參考咨詢和圖書館學教育等方面,保證了專家群體科學性調查的質量。
3.1總加量表調查
調查圖書館學發展數據化的專家態度,受訪者的評估主觀性較強,因此采用態度測量技術(量表)進行調查。問卷第一部分采用總加量表統計數據對圖書館學的影響程度,根據研究領域分析,總加量表部分設置了數據對圖書館實踐、對圖書館學研究和對圖書館學教育的影響三個角度,共20個問題,專家態度平均分情況如表3所示,在調查統計結果中,第一部分中每個項目的平均得分均大于3分,說明項目的設置是比較合理的。
專家態度評分中平均分最高的三個問題分別是“讀者的閱讀、訪問數據的分析和挖掘對于圖書館提供個性化服務的影響”“數據運用能力對于圖書館學專業學生就業的影響”和“數據素養對圖書館學學生專業能力的影響”,可見大多數專家認為數據對圖書館實踐和圖書館學教育兩個方面的影響較大;此外,關于數據對圖書館學研究的影響平均分最高值為4.3分,表示多數專家認為數據對圖書館學研究熱點的影響較大,最低值為3.8分,說明專家認為數據對圖書館學研究對象的影響較小。
3.2累積量表調查
問卷第二部分采用累積量表調查圖書館學發展數據化的影響因素,同樣以圖書館實踐、圖書館學研究和圖書館學教育三個領域為基礎,共設置12個問題。累積量表專家態度評分情況如下頁表4所示,專家根據個人觀點選擇數據是否對量表中的選項產生影響。專家評分情況可以清晰地顯示出所有選項得分均大于零,根據累積量表的記分法和得分原則,保留得分為正數的選項,項目全部保留。
按照圖書館實踐、圖書館學研究和圖書館學教育三個領域(下頁圖3中簡稱為實踐、研究和教育)分別將題目得分從高到低進行排序,整理得到圖3,橫軸為題目得分,縱軸為題目所屬領域和題目序號。圖書館實踐領域中題目9、10得分最高,對應的是圖書館用戶服務和館員綜合能力;圖書館學研究領域中題目3、5得分最高,對應的是圖書館學研究工具和圖書館學研究熱點;圖書館學教育領域中題目12得分最高,對應的是圖書館學學生綜合素質。
在專家態度評分的基礎上進一步分析,按照答案為“是”的數量將各問句從左至右順序排列,回答“是”得1分,得到重新整理的表格如下頁表5所示。經過排列,所有的結果構成了一個階梯形態,累積量表法就是利用此形態來作為判斷語句和量表的基礎。階梯形態外有兩項“否”的回答,通常采用再現系數R來計算出現的誤差是否能夠被接受,如果量表再現系數R大于0.9,就稱該量表是單維度的,每個人的態度得分就是他回答贊成的項目總數。如果R小于0.9表明量表設計欠準確。此量表的R值為0.983,設計較為準確。——論文作者:金勝勇張琪
SCISSCIAHCI