發布時間:2021-07-17所屬分類:管理論文瀏覽:1次
摘 要: [摘要]自美國數字圖書館計劃啟動之時,國外就掀起了對該領域探索的熱潮。因此,關注國外數字圖書館領域的研究現狀,對研究數字圖書館領域具有重要的基礎意義。研究以WOS核心合集為數據源,檢索數字圖書館領域的文獻,運用R語言、文獻計量法、文獻調查法和內
[摘要]自美國數字圖書館計劃啟動之時,國外就掀起了對該領域探索的熱潮。因此,關注國外數字圖書館領域的研究現狀,對研究數字圖書館領域具有重要的基礎意義。研究以WOS核心合集為數據源,檢索“數字圖書館”領域的文獻,運用R語言、文獻計量法、文獻調查法和內容分析法對樣本文獻的發表年份,高影響作者、文獻、期刊及機構進行多角度分析,以ggplot函數生成相關可視化圖譜。研究發現,國外數字圖書館領域的研究文獻增長已趨于穩定、研究程度已趨于成熟;在數字圖書館領域內的各學科知識交叉流動日益明顯、跨學科性突出;當下國外對該領域的探索更加細微、切入點更加多元、應用方法更加科學、研究層次更加深入。
[關鍵詞]數字圖書館R語言知識圖譜可視化
1引言
“美國數字圖書館計劃”于1994年啟動[1],自此作為傳統信息時代圖書館的延伸與擴展[2]———數字圖書館開始出現。歷經數十年的快速發展,數字圖書館已成為集數據資源為一體、以用戶為中心、以各種信息技術為手段的綜合分布式平臺[3]。隨著人類進入到數據科學社會,數字圖書館的研究和建設受到了前所未有的重視,學界針對數字圖書館領域進行了多維度的深入探索。國外已有學者對該領域相關研究成果做了綜述,較有代表性的是:里烏利用發表在圖書情報科學期刊上的577篇文獻進行計量分析,重點關注組織和人的問題,包括哪些涉及社會、文化、法律、道德和使用維度的問題[4];吉姆采用仿形分析、平行最近鄰聚類和基于聚類的網絡方法分析“數字圖書館”的相關研究領域[5];狄克瑪在對四個不同數據庫進行全面檢索的基礎上,分析了多語種數字圖書館的核心文獻,并對這一主題的文獻進行了闡述[6]。但經過十余年的發展,國外數字圖書館研究領域已出現許多新的研究分支與生長點,并產出了很多新穎的研究成果[7]。因此,重新對國外數字圖書館的研究發展情況進行系統梳理是很有必要的。本文以R語言為分析工具對相關文獻進行了深入分析探討,以期為后續相關研究作出一定的貢獻。
2數據來源及處理
為精選研究樣本,文獻選取WOS核心數據庫為數據源,并行設置“Subject”和“Title”均出現“digitallibrary”的檢索條件,時間框選定為2006年初至2019年末,檢索并導出全記錄與引用的參考文獻共計990篇樣本文獻。本文采用“R語言+文獻計量分析法+文獻調查法+內容分析法”對研究樣本進行分析。
首先,通過R語言自編程序分別提取出文獻的發文時間、高被引作者、高被引文獻、文獻所屬期刊以及文獻產出機構這五個要素所對應的數據。其次,清理提取出的數據:在文獻發文時間分析中,檢索并剔除空值年份的文獻,共計得到990篇有效文獻;在高被引作者分析中,通過自編程序對作者進行消歧工作(包括剔除匿名作者),計算得到作者的全局被引次數(TC)與本地被引次數(LCS),選取出TC值與LCS值排名在前20位的作者(共計35位作者);在高被引文獻分析中,提取出選定樣本的TC值以及本地21981條參考文獻所產生的LCS值,選定排名在前20位的文獻(共計33篇)配以“作者+出版時間+期刊簡稱”的關鍵信息;在文獻所屬期刊的分析中,提取出“J”類型的期刊文獻共計947篇,利用布拉德福定律進行核心區、中間區、后繼區的計算;在文獻產出機構分析中,通過檢索出文獻樣本所屬“Institute”數據,對產出自同一機構的文獻進行累加,并將其按照降序排列;然后利用ggmap、cowplot等程輯包和ggplot函數分別生成發文時間分布圖譜、高影響作者圖譜、高影響文獻圖譜、高影響期刊圖譜、以及高影響機構發文散點圖,最后以控制臺運行plcstop函數獲取各文獻DOI編號,以便檢索到對應文獻進行內容深度解析。
3研究結果
3.1發文時間分布
文獻發表時間的分布情況可以在一定程度上反映該研究領域某階段的研究情況。在圖1中,橫坐標為年份,左邊標尺為年均發文量,右邊標尺為總計發文量,紅色折線對應年均發文量,藍色折線對應總計發文量。
3.1.1發文時間階段研究研究
結果表明,國外數字圖書館領域的相關研究大致經過了三個階段,第一階段為快速萌芽期(2006-2008年),發文量共304篇,年均達101篇,且在2006年,發文量達到頂峰(136篇),這一階段僅為3年,但研究內容已涉及到數字圖書館領域的多個方面,如數字圖書館的使用、發展、咨詢服務方面,影響用戶使用的因素方面以及用戶使用的意愿等,為后續研究做了重要的鋪墊。第二階段為發展波動期(2009-2015年),發文量共487篇,年均69篇,這一階段持續了7年,發文量上下搖擺度大。隨著計算機分析與圖譜繪制工具的出現,在該研究階段計算機科學領域與圖書情報科學領域具有較大的交叉強度,評價模型、知識系統與復雜算法的探索與實證成為該階段的重要研究內容。第三階段為穩定增長期(2016-2019年),發文量共199篇,年均49篇,此階段處于國外數字圖書館研究領域的成熟時期,發文量沒有出現很強的波峰,研究者多關注于數字圖書館的系統評價模型和未來發展趨勢等方面,在該階段各領域的交叉融合度進一步加深,數字圖書館領域的跨學科性進一步彰顯。
3.1.2發文峰值點及趨勢研究
從圖1可以觀察到有兩處高峰值年限點(2006年,2014年)。2006年收錄的文獻數為136,在圖中處于最高值。這是由于在2006年,以美國為首開展的數字圖書館項目在世界各地紛紛啟動,各國對數字圖書館領域開始了不同程度的探索。其中,美國在2006年產出了59篇文獻,占全年數量的43.38%,為該領域貢獻最多的國家;而中國總計產出5篇文獻,占比僅為3.68%。相較于美國的探索程度來說,我國此時仍處于萌芽階段,研究進展相差懸殊。在2014年,美國產出26篇文獻,占全部文獻量的28.89%,仍居于貢獻榜首,而中國共計發文12篇,占比12.22%。相較于前一峰值點,中國產出文獻占比和產出文獻數均有大幅增長,反映出中國對數字圖書館領域的研究進入了加速發展階段。
從整體趨勢上看年均發文數量呈下降趨勢,這并不是說明該領域不受重視,主要原因在于國外針對該領域的研究已達到穩定期,經作者計算,得到該領域的總體發文趨勢線為y=65.903x+99.582,R2=0.9856,R2趨近于1,預測該領域在2020年的發文總量將保持在50篇左右,總體呈穩定增長的態勢。
3.2高影響作者分析
為進一步分析該領域內的高影響力作者,文獻通過TC與LCS指標對作者進行學術評價。TC是指被WOS核心數據庫全局引用的總次數,LCS是指在特定領域內被引用的總次數,在本文中特指WOS核心數據庫中的數字圖書館領域。將兩圖中重復出現的作者用底線標注,研究結果如圖2所示。
3.2.1作者整體分析
由圖可知,在TC圖與LCS圖均出現的作者共有五位,分別為埃雷拉·維德瑪、弗里亞斯·馬丁內斯、陳淑珍、謝鴻、加布里佐,其中作者埃雷拉·維德瑪以被引558次在TC值排名中居于絕對領先的位置,其被引用次數為絕大多數作者均次的4-5倍。經R語言解析發現該作者的發文多圍繞決策算法、層次模型、系統模型等主題,主要被計算機科學與技術領域、信息科學與工程領域、圖書情報科學領域引用,一方面說明了該作者產出的文獻質量高、影響力大,受到了相關研究領域的重視;同時表明了該作者產出文獻的可交叉性、可適用性、可融合性較高,在一定程度上加速了跨學科領域的融合與發展。在TC值中位居第二位的作者波塞爾被引次數也較高(322次),經分析該作者的文獻多以模糊決策、復雜算法、推薦系統為研究主題,其發文主要被計算機科學與技術領域、知識系統領域、圖書情報科學領域所引用。值得注意的是,該作者就數字圖書館設計了多學科資源推薦服務系統,為后續資源推薦系統的研究做了重要支撐。同時,考察到波塞爾與埃雷拉·維德瑪有多次科研協作,這也是該作者被引次數較高的原因之一。通過對TC值為100左右的作者進行考察,發現大多數作者的研究方向均不唯一,主要分布在數字圖書館領域用戶行為研究方面、用戶需求實證研究方面,數字圖書館系統搭建、應用與評價方面和計算機科學與技術領域復雜算法、系統模型方面,所采用的研究方法也涉及到多個學科門類,促進了不同領域之間的知識流動。
從LCS圖中可知,相鄰作者被引次數相差較小,并沒有出現TC圖中的斷崖式下降。但是,最大值與最小值的差值也達4倍之多,這與TC圖基本保持一致。作者謝鴻以LCS值42居首位,說明在數字圖書館特定領域內,作者謝鴻具有重要的領頭作用。分析其相關文獻,發現該作者的高被引論文均為數字圖書館評估與評價研究方向。隨著數字圖書館的發展,采用什么樣的評估體系與如何評價數字圖書館是必不可少的方面;且該作者的發文多集中于《Evaluationofdigitallibraries》系列圖書,這也是該作者在數字圖書館領域引證高的原因之一。LCS圖中的其他作者,可認為是數字圖書館領域內的中堅作者。通過分析其發文分布,發現數字圖書館體系、用戶與數字圖書館、數字圖書館服務是重點研究方向。因多數作者研究方向不存在絕對的專一性,所以后續研究者就自身研究點在引用文獻時具有一定的主觀選擇性,從而使得中堅作者被引情況呈現溫和下降的局面。
3.2.2作者位次變化分析
對比兩圖中同一作者的位次變化可知,有3位作者位次下降,2位作者位次上升。其中,弗里亞斯·馬丁內斯下降了14位,是下降位次最多的作者;埃雷拉·維德瑪下降1位;陳淑珍下降了2位;謝鴻上升了6個位次,是位次上升最多的作者;加布里佐上升了3位。分析得出,在TC圖中研究者普遍涉及到兩個或多個研究領域,研究范圍大幅度交叉,因此施引作者也分布在計算機科學、工程科學、管理學、圖書情報學等多個領域。例如作者埃雷拉·維德瑪就語言評估背景下研究了群體決策一致性模型,該文獻在計算機科學領域、工程科學領域、圖書情報領域均有引用且頻次不一,說明該文獻具有較強的普適性和奠基性,也解釋了該作者在TC值中位居前茅的原因,佐證了該作者的學術影響力。對于下降位次較多的作者也可做相同的解釋,但這不能說明該作者的學術能力弱,只能說明該作者的論文還未被特定領域所大范圍引用。另外,本文認為位次上升的作者是數字圖書館領域研究的專攻員,如作者謝鴻發文大多為數字圖書館評估體系方向,被引次數高說明該作者產出的文獻質量優越,為該分支研究領域作出了重要貢獻。
在TC圖與LCS圖中,有30位作者只出現一次,這說明不論是在WOS全局核心數據庫中,還是限于數字圖書館領域,研究者對于該領域有著較高的關注度,且因絕大多數作者的研究方向均涉及多個研究領域,研究方法也常出現交叉或借鑒,也在一定程度上印證了數字圖書館是學科背景豐富、融合度高、交叉性強的研究領域。
3.3高被引文獻分析
高被引文獻是一個領域研究發展中支柱性的存在,對領域的發展有著重要的導向作用,本研究同樣以TC、LCS指標去勘探數字圖書館領域的高被引文獻,TC圖是選定文獻在核心數據庫中被引用次數的可視化展現,LCS圖是在本地21981條參考文獻中生成,將兩圖中重復出現的文獻用底線標注。
3.3.1文獻整體分析
由圖可知,在TC圖和LCS圖中共現的文獻共計7篇,主要涉及到數字圖書館推薦系統方向、數字資源整合方向、數字圖書館的評估方向和用戶研究方向。作者波塞爾以文獻被引154次居首位,其被引次數為最低文獻被引次數的3倍左右,該文獻提出了一種模糊語言推薦系統,能夠更好的獲取用戶偏好,以此方便數字圖書館資源的充分利用。經R語言分析其引文網絡發現,該文獻的被引領域高達29個,其中引用次數最多的是計算機科學領域、信息系統領域以及跨學科應用領域,充分表現出該文獻的跨學科性和多元融合性。TC圖中其他文獻從不同方法、不同維度、不同時間上進行研究,絕大多數文獻均涉及到2-3個研究領域以及不同學科的研究方法,從不同的學科背景推動了該研究領域的進展。
文本觀察到在TC值圖中,作者波塞爾與作者謝鴻均產出2篇文獻,但作者波塞爾產出的2篇文獻均沒有在LCS圖中出現,原因在于這2篇文獻的內容均具有較強的學科交叉性,多被計算機科學人工智能領域、計算機科學信息系統領域所引用;此外,LCS圖僅展示選定樣本的在數字圖書館領域前20位高被引文獻,經R語言查看后續排名驗證,發現這2篇文獻均在圖書情報學領域被引用5次。
在LCS圖中,相鄰文獻被引次數差值隨名次下降而緩慢下降,但是,首末文獻的被引次數也差3倍之多,這與TC圖基本保持一致。其中,作者謝鴻在2008年產出的文獻以23次被引居首位,該文從用戶角度出發,闡述了用戶看待數字圖書館評價的標準和問題。這篇文獻在數字圖書館評價、數字圖書館評估體系、數字圖書館用戶研究中均有引用。LCS圖中的其他文獻,均可認為是數字圖書館領域的專研文獻,對于數字圖書館分支領域的發展具有重要的意義。
3.3.2文獻時區分析
在選定樣本中2008年,2012年產出高被引文獻最多,分別為9篇,5篇,可認定是對數字圖書館領域做出重要貢獻的年份。考察2008年與2012年的高被引文獻內容,發現主要的研究方向是數字圖書館的服務改進與相關建議、對圖書館質量的評估以及用戶與數字圖書館系統的關聯,其中最有代表性的觀點有:作者諾吾奧德在2008年以個人差異和系統特征作為感知易用性的決定因素,探討了“抗拒改變”RTC與高校數字圖書館感知易用性之間的關系,提高了數字圖書館被使用的效率與質量[8]。作者唐杰在2012年提出了一種動態估計人數進行名稱消岐的兩步參數估算法,并提出優于聚類算法的概率框架,為模糊消岐工作做出了巨大的貢獻[9]。與此同時,作者謝鴻以用戶為基點,讓用戶親身體驗兩個數字圖書館,并寫出他們的評價標準與評估結果,進一步探討了數字圖書館評價標準的感知重要性、數字圖書館的使用與數字圖書館評價之間的關系以及用戶對數字圖書館評價的偏好、經驗和知識結構[10]。
3.3.3文獻位次變化分析
在共現的7篇文獻中,作者謝鴻產出了2篇文獻?疾爝@7篇文獻的位次變化發現:作者帕克在2009年發表的一文由左圖第2名下降到右圖第18名,下降了16位,是下降名次最多的文獻,作者諾吾奧德在2008年發出的文獻也由TC值第7位下降到15位,下降了11個位次,羅斯在2008年產出的文獻上升了3個位次,作者查克納斯在2008年產出的文獻由位次14上升到第9位,同時作者施里法馬迪在2008年產出的文獻也由TC值排名中的18位上升到了LCS圖中的第11位,而作者謝鴻的兩篇文獻均呈現不同位次的上升情況,其中一篇從位次11上升到第3位,另一篇從位次15躍居到LCS圖首位,是上升位次最多的文獻。
文獻位次下降并不表明該文獻質量低、影響力低。相反正是該文獻具有一定影響力的體現,因為文獻是被多個領域所引用,只是某一文獻在數字圖書館領域中被引數較低;又因文獻研究的方向較為獨特、切入點不同,也是導致引用數量較低的因素。如作者帕克在2009年發表的論文:以發展中國家為切入點,從宏觀出發探索影響各國用戶使用數字圖書館的因素,并為促進發展中國家成功采用數字圖書館系統,借用技術接受模型ATM測試數字圖書館在發展中國家的適用性[11],通過引文網絡分析發現該文獻被25個領域的不同作者所引用,引用領域并不集中于數字圖書館領域,但在本文限定核心數據庫數字圖書館領域中的21981條參考文獻中,被引用次數不是那么高。針對在TC圖轉向LCS圖位次出現上升的文獻,可判定為專研數字圖書館領域的文獻。最具代表性的是作者謝鴻在圖書中《DiscoverDigitalLibraries》刊登的兩篇文獻,分析其內容發現兩篇文獻均為從用戶的角度探尋數字圖書館的評價標準,并基于用戶主體的判斷標準匯編了質量收集量表,最后借助分析結果揭示了當前數字圖書館設計與開發中存在的問題,提出改進數字圖書館設計的建議[12]。該文認為數字圖書館的評估不僅要確保其正確的演化,而且要得到用戶和應用群體的接受。這個觀點在現在看來仍具有至關重要的意義,因此在數字圖書館領域中存在較高的引用值。
3.4高影響期刊分析
因高影響文獻在一定程度上對所屬期刊有影響,所以本文在高影響文獻的基礎上,繼續分析該領域的高影響期刊。本文樣本數據僅來自于WOS核心數據庫,并不能代表整個領域的研究狀況,因此會在計算數值上產生相對偏差,但布拉德福定律仍對我們探尋該領域的高影響期刊具有一定的幫助。借助R語言得到核心區期刊散點圖,如圖4。其中主圖是按照布拉德福定律繪制的核心期刊圖(因圖幅面積有限,僅展示核心區期刊名稱),輔圖是按照核心期刊年均載文量進行統計說明的期刊散點圖。——論文作者:孫宗緣1馬秀峰2
相關期刊推薦:《河南圖書館學刊》雜志創于1981年,雙月刊,是由河南省圖書館主管,河南省圖書館學會和河南省圖書館主辦內外公開發行的圖書類期,內容主要包括圖書館學理論研究,圖書館工作經驗交流以及普及圖書館知識。主要讀者對象是廣大圖書館工作者和情報工作者。以貫徹黨的“百花齊放,百家爭鳴”的方針,促進圖書館學理論研究、交流圖書館工作經驗,普及圖書館知識
SCISSCIAHCI