學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

促進數據、信息和知識融通 ———2020年JCDL年會論文綜述

發布時間:2021-06-08所屬分類:管理論文瀏覽:1

摘 要: [摘要][目的/意義]通過對2020年國際數字圖書館聯合會議(JointConferenceonDigitalLibraries,JCDL)的錄用論文進行整體回顧,梳理與分析當下數字圖書館的研究內容與研究發現,為我國相關領域學者把握學科前沿提供參考。[研究設計/方法]采用文獻綜述法,對本屆

  [摘要][目的/意義]通過對2020年國際數字圖書館聯合會議(JointConferenceonDigitalLibraries,JCDL)的錄用論文進行整體回顧,梳理與分析當下數字圖書館的研究內容與研究發現,為我國相關領域學者把握學科前沿提供參考。[研究設計/方法]采用文獻綜述法,對本屆年會論文所反映的研究熱點與前沿進行歸納總結與提煉。[結論/發現]本屆年會覆蓋研究主題廣泛,呈現出與數據科學協同合作的趨勢,聚焦于用戶信息活動的探索、未來圖書館的建設、細粒度化與精準化智慧服務的提供等方面,具有較明顯的跨學科特性,且在新型冠狀病毒肺炎的公共衛生危機下更加關注生物醫學信息學的價值。[創新/價值]揭示了當前圖書情報與信息科學的研究熱點與趨勢。

促進數據、信息和知識融通 ———2020年JCDL年會論文綜述

  [關鍵詞]國際數字圖書館聯合會議數字圖書館圖書情報學數據科學用戶研究

  1引言

  ACM/IEEE數字圖書館聯合會議(JointConferenceonDigitalLibraries,JCDL)是數字圖書館領域歷史最悠久、學術性和影響力最大的頂級國際會議。

  JCDL由國際計算機學會(ACM)和電氣電子工程師協會(IEEE)聯合主辦,與歐洲數字圖書館會議(ECDL)、亞洲數字圖書館國際會議(ICADL)并稱為全球數字圖書館研究領域的三大國際學術會議,重點討論數字圖書館以及相關的技術、實踐和社會問題[1]。

  首屆JCDL于2001年8月24日至28日在美國弗吉尼亞州羅阿諾克舉辦。自首屆舉辦以來的二十年間,JCDL吸引了來自世界各地涉及數字圖書館研究與實踐的學科和專業的人士參加,包括計算機科學、信息科學、圖書館學、檔案科學與實踐、博物館研究與實踐、醫學、社會科學和人文科學等,為各國專家學者提供了一個多學科交融、思想交鋒的平臺,展示國際信息管理研究的最新前沿進展。

  2020年8月1日至8月5日,由武漢大學信息管理學院和西北大學公共管理學院主辦的第二十屆JCDL會議在湖北武漢舉行,這是JCDL首次在亞洲舉辦。由于新型冠狀病毒肺炎(COVID-19)在全球肆虐,與以往歷屆JCDL會議不同,本次JCDL會議首次全部虛擬化,以線上形式召開。

  本次會議的主題為“加快創新、可持續發展與轉型(SpeedierInnovation,SustainableDevelopment,SocietalTransformation)”,在COVID-19背景下該主題顯得更加迫切與真實,同時會議的成功召開亦為武漢大學信息管理學院百年院慶系列活動書寫了濃墨重彩的一筆。本文主要對本次年會相關論文的內容進行分析和總結,重點介紹了各國學者的最新研究進展,探討了數字圖書館領域的發展趨勢,以期為國內圖書館領域的學者提供幫助,全面了解本次年會及其最新研究趨勢,掌握國際數字圖書館研究領域的前沿熱點問題。

  2年會概況

  2.1收錄論文及作者國家(地區)分布

  本屆年會共收到來自5大洲35個國家的980名數字圖書館及相關領域的專家學者的380余篇論文,會議來稿數量為歷屆之最。論文保持JCDL一貫以來的嚴格錄用標準,經程序委員會審查收錄了長篇研究論文(FullResearchPaper)33篇(錄用率31.1%),短篇研究論文(ShortResearchPaper)28篇(錄用率31.1%),以及海報(Poster)40篇和演示(Demonstration)8篇。雖身處不同時區,但全球各地的與會者依然對會議保持了高度熱情,共有來自全球20余個國家和地區的約380名與會者線上參會。

  本屆年會的作者國家(地區)分布如表1所示,相較于2019年,來自中國、美國、印度和德國的學者仍然是年會的核心。其中來自印度的學者有上升趨勢,來自中國(含香港、澳門和臺灣地區)的學者作為本屆年會的主力軍,其數量從2019年的43位增長為118位(占比32.69%),充分體現了中國在圖書情報與信息管理研究與人才培養方面日益國際化的發展趨勢。另一方面,合著關系數據表明中國在領域內的學術合作對象相對局限,需加強跨國合作的廣度和深度,增進學術交流發展和國際影響力提升。

  2.2年會相關學術活動

  在為期5天的議程中,除了18場論文會議(PaperSession)、2場專題討論會(Panel)、5場培訓會(Tutorial)、7場研討會(Workshop)、1場海報和演示會議、1場博士生論壇(DoctoralConsortium)外,本屆年會新增了實踐案例(PractitionerTrack)模塊。這一創新為圖書館、檔案館和博物館的從業者和出版商以及數字內容行業的合作伙伴提供了學術舞臺,展示了與數字圖書館實踐和服務相關的前沿、探索性或有爭議的想法和實踐。

  2.3收錄文獻關鍵詞分布

  對2020年JCDL文獻的關鍵詞分析顯示(圖1),本屆年會關注大數據時代下的數字圖書館如何建設。最高頻次的關鍵詞是DigitalLibrary(數字圖書館)和BigData(大數據)。除此之外,DeepLearning(深度學習),WebArchiving(網絡資源存檔),Bibliometrics(計量學),DigitalPreservation(數字保存)均為出現頻次較高的關鍵詞。從關鍵詞分布來看,低頻關鍵詞占主要部分,關鍵詞間的頻次差距較小,覆蓋研究主題寬廣,具有較明顯的跨學科特性。

  相關期刊推薦:《圖書情報知識》(雙月刊)1983年創刊,本刊欄目設置頗具特色,多前沿理論,學術信息量大,論文轉摘率高。常設四個欄目:“博士論壇”、“圖書、文獻與交流”、“情報、信息與共享”、“知識、學習與管理”。應變欄目:“特約稿”、“名家專論”、專題”、“學科前沿”等。其中,“博士論壇”欄目在國內獨樹一幟,作者為博士及博導級的專家學者,所刊發的論文幾乎全部被人大復印報刊資料全文轉載

  結合關鍵詞分析與文獻內容分析,本屆年會收錄文獻涵蓋了與數字圖書館有關的廣泛主題,展現了核心研究領域、傳統研究領域和新興研究領域的研究進展,為數字圖書館的創新與應用創造更多技術形式,為圖書館體系結構未來發展提供建議。下文將從互聯網技術下的未來數字圖書館探索、新環境下以人為本的用戶研究探求、大數據背景下的信息計量與科學評價優化三個維度綜述本屆年會在不同研究領域所取得的最新進展。

  3互聯網技術下的未來數字圖書館探索

  3.1數字圖書館服務———提高現代公共服務的普及程度和便利性

  互聯網的出現和相關技術的發展,不僅增加了信息量,也改變了傳統圖書館和信息服務的性質。數字圖書館已成為現代數字信息系統的重要組成部分。學術數據集和在線學術文獻檢索平臺,如IEEE/IEE電子圖書館、Wiley在線圖書館、施普林格LINK、谷歌學術檢索等,可以視為現代數字圖書館的代表。本屆年會,學者們研究的圖書館范圍不僅限于存儲庫,還包括新形式的信息機構、具有各種數字內容的領域信息系統、數據項目與信息媒體等。

  (1)著眼未來數字圖書館構建,加快傳統服務改進與轉型。Fox[2]強調了5S框架(Societies,Scenarios,Spaces,Structures,Streams)對數字圖書館搜索、瀏覽、推薦和可視化等服務的建立與應用的簡化。Zhou[3]探討數字圖書館的數字生命周期程序,期望建立跨學科研究的平臺和大型聚合數字內容的存儲庫,確保數字圖書館的廣大用戶能夠有效地獲取不同領域和平臺的聚合內容。Liao[4]對圖書館智能服務的核心學術理論進行梳理,整合為圖書館智慧服務核心要素的理論框架,有助于數字圖書館傳統服務向創新驅動發展轉型。

  (2)加強數據項目建設,開辟應用支持新途徑。匹茲堡大學圖書館系統(ULS)的東亞圖書館(EAL)啟動了當代中國村落數據(CCVD)項目[5],建立了一個對中國人文和社會科學研究具有重要價值的數據集,包括政治、經濟、社會學、環境科學、歷史和公共衛生等領域的定量和定性數據。Jean-Caurant[6]的NewsEye項目訪問和調查了大量多語言報紙數據,促進學者和公眾對歷史報紙的研究。Ostendorff等人[7]致力于開放式法律數據平臺的開發,為透明處理和開放訪問法律信息提供支持。

  (3)重視醫療數字化,探索數字圖書館醫療健康服務。Mohd[8]展現了基于醫療保健的COVID-19相關出版物如何隨著時間的推移而變化,服務醫療一線、科學家、立法者等利益相關者對抗病毒。Wawrzinek等人[9]為藥物與疾病之間的復雜關系生成可直觀理解的短句解釋,能夠在藥物再利用等醫療任務中發揮核心作用。Zhenni等人[10-11]探討了基于電子病歷的疾病診斷、預測和篩選等熱點問題,通過健康檔案的數字化、網絡化與信息化提高護理質量。

  (4)聚焦信息媒體,協助個人和社會形成意見與決策。社交媒體賬戶已逐漸成為普及信息和公眾溝通的主要平臺,同時也帶來了假新聞和媒體所有權集中等社會問題。Spinde[12]團隊創建了具有政治傾向標簽的媒體數據集,并借助可視化手段傳達媒體偏見,幫助新聞消費者意識到偏見的存在。Hamborg等人[13]通過詞匯選擇和標簽(WCL)分析偏見的目標依賴情緒,有助于對新聞文章傾向性和真實性的正確認識。

  3.2交叉融合圖書館開發技術創新———促進數字資源的長期保存和長期可用性

  大數據具有大量、高速、多樣、低價值密度、真實性的特點。管理由不同來源聚合的多模式數據集,以確保數字資源的可用性,是一個日益嚴峻的數據管理挑戰。新一代信息技術如機器學習、深度學習,特別是語言技術與數字圖書館的融合,已成為數字圖書館研究領域和本屆年會學者的重點研究課題。

  (1)將網絡資源存檔作為大數據源進行統計和分析研究的勢頭正穩步上升。相較于傳統網絡檔案,如何從網絡資源存檔數據中識別出高質量的文檔被Patel等人[14]關注,以對原始數字材料提供更有意義的訪問。Adewoye等人[15]提供了一種使用圖像查詢在網絡資源存檔中快速找到相關圖像的方法。Ruest等人[16]介紹了始于2017年的檔案釋放項目,該研究成果也適用于推特、電子郵件、電子文檔和演示文稿,以及大量的原始數字記錄。WARC是Web存檔廣泛使用的文件格式,Wang等人[17]的研究表明其對批處理工作量具有重大的性能損失,呼吁網絡資源存檔社區考慮用更有效的網絡資源存檔格式代替WARC。

  (2)增強更多樣化數據集成的可伸縮性與靈活性,使多模式數據能夠符合與主流數字圖書館類似的館藏要求。不同來源的數據可能包含關于實體的不明確、互補或重復信息,消歧是分析和探索館藏的必然選擇之一。Linhares等人[18]描述了一個可實現多語言消歧的跨語言命名實體鏈接(XEL)系統,能夠適應任何源語言對的跨語言擴展。Jhawar等人[19]對比隨機森林和決策樹的性能,研究基于集成分類算法的PubMed著者姓名消歧。Repke和Krestel[20]結合數字圖書館文本和網絡的二元性,提出了一個可伸縮的多目標降維算法MODiR,在二維畫布上實現大型文檔集合的可視化。

  (3)促進數字圖書館語義上的可持續性。本屆會議專門開展了主題為“語義可持續數字圖書館的概念模型與本體模式”的討論會[21]。在會議中,盧布爾雅那大學MajaŽumer、武漢大學XiaoguangWang教授、四川大學WeiFan教授、雪城大學JianQin教授對如何促進數字圖書館語義上的可持續發展進行了探討,并在實踐社區,特別是在瞬息萬變的數字社會和新興應用領域中達成共識。

  (4)通過分類技術促進對知識的理解與組織。數字圖書館得益于文本分類策略的使用,除了標準分類,本屆年會學者拓展探究了短文本小數據集[22],層次分類[23-24],甚至非文本內容(如數學元素)的分類任務[25-26],針對特殊問題設計適合的分類策略,有助于促進數字圖書館下游文檔管理任務,如信息檢索的執行。

  3.3數字人文———通過數字化手段開放和保護世界文化遺產的全球趨勢

  在數字時代,數字人文已經成為運用數字媒體和計算機技術對人文資料進行發現、保存和解讀,以便更好、更深入地了解當前社會的術語。而數字圖書館已經成為數字人文學科(DigitalHumanities,DH)和文化分析研究的重要實驗室。本屆年會的學者也關注著圖書館在數字人文背景下的數據組織與重構服務,并通過多元化方法和數字化手段,如數據擴充、神經網絡等,對人文歷史資源展開研究。

  (1)改善數據集數字化輸出與保存質量。盡管數字圖書館館員和學者都提倡基于數字圖書館規定的DH研究,但在部署DH研究的數據集時仍然存在許多問題。現代OCR技術的局限性限制了電子數據轉化質量,Nguyen等人[27]采用深度學習的方法,在OCR糾錯方面取得了大幅改進。Hu等[28]指出文獻數據集中普遍存在重復文獻、數據分布不均、OCR錯誤等問題,建議數字圖書館的利益相關者標記并解決這些局限性,以提高數字人文研究背景下數據集的代表性和可用性。

  (2)文化遺產數字圖書館的需求與主流數字圖書館技術的發展同步。本屆年會關注書法、文學、民族音樂、篆刻[29]等傳統文化及歷史人物作品的保存和欣賞。文化遺產由于數據量小的特殊性,面臨著網絡訓練的問題,Pang等[30]提供了一種以字形和筆畫特征擴充書法圖像數據的方法,最終搭建了數字書法知識服務系統。Chudy等人[31]提出了基于dLibra數字圖書館的傳統音樂研究平臺MIRELA,可以支持音樂內容的檢索。Adak等人[32]通過將甘地文學數字化并構建時空社交網絡,在Gandhipedia人工智能門戶網站形象地展示了圣雄甘地的生平事跡。虛擬現實(VR)技術被推薦為呈現文化遺產信息的一種創新媒介,Ng等人[33]通過對用戶報告和眼動數據的分析,表明VR內容中文本注釋有助于促進用戶對文化遺產的理解,探討數字圖書館中文化遺產VR展示的最佳實踐。

  4新環境下以人為本的用戶研究探求

  4.1精準化理解用戶搜索行為———設計面向通用訪問的數字圖書館

  數字圖書館已成為用戶檢索信息的關鍵信息檢索系統。目前的搜索系統在為用戶尋找相關信息方面做得很好,但如何設計出能更好地支持用戶完成任務的搜索系統,尤其是當用戶面對復雜的搜索任務時,還需要更多的研究[34]。本屆會議中Huang[35]與Wang團隊[36]采用比較研究的方法,分析任務的主、客觀難度對用戶搜索行為的影響,其他學者們從用戶學習過程和個性化的角度進行了研究。

  (1)用戶信息搜索中的學習行為及過程探究。信息檢索并不是一個尋找特定問題答案的過程,而是一個探索和學習的過程[37]。為了幫助提高知識獲取率,Zhang等人[38]將參與者繪制的思維導圖作為表示用戶知識的工具,從詞匯的視角研究用戶在信息搜索過程中的知識使用和變更,結果表明用戶的先驗知識通過提供解決問題的結構和制定查詢的詞匯庫來影響信息搜索。Liu等人[39]通過對不同領域用戶的定性研究,提出了探索性搜索中知識構建過程的概念模型,該模型基于知識節點、知識社區和知識網絡等一系列核心過程。

  (2)將個性化技術用于用戶信息搜索領域,提高信息搜索效率。隨著個性化技術的進步,基于偏好的web搜索成為可能。Hu等人[40]分別基于關聯規則與二部圖方法開發了兩種個性化圖書推薦原型,將自動個性化推薦服務整合到面向青少年讀者(尤其是小學學生)閱讀的在線學習平臺中。然而個性化技術也會導致泡沫過濾,不斷向用戶提供強化先驗信念的信息,阻礙學習過程。針對此問題,Yamamoto等人[41]研究了一個網絡搜索界面PESONALITYFINDER,能夠將個性化程度可視化,揭露和管理隱藏在個性中的網絡搜索結果,旨在使用戶意識到網絡搜索結果往往帶有偏見,進而推動關鍵信息搜索。

  4.2智慧化構建用戶服務體系———展現面向所有人的公共圖書館擔當和社會包容

  數字圖書館的服務模式和服務內容逐漸由文獻型向用戶型轉變[42],圖書館服務必須適應用戶需求,提高內容交付、易用性和服務響應能力[43]。本屆年會相關研究也凸顯出這一趨勢,利用圖書館大數據與用戶行為數據資源,充分關注用戶的興趣特征和數據內容要求,從用戶的角度考慮當前用戶需求的特點,為數字圖書館現有服務的改進提供有效的思路和方法。

  (1)了解用戶特征。性別是數字圖書館服務研究中通常被忽略的因素。為了研究閱讀偏好的性別差異,McKay等人[44]考察了性別與閱讀形式(印刷與在線)之間的相互作用,以了解數字閱讀是否會出現更多的性別越界閱讀。Jayawardena等人[45]通過眼動測量,深入了解新手在閱讀研究論文時的掃描路徑。背景音樂服務已在智能圖書館中提供,Liu等人[46]基于音樂聲學特性、使用者個性特質以及可穿戴腕帶所記錄的生理信號,建立了一個音樂推薦系統,指出個性特征對推薦準確率的提高有顯著作用,而生理特征的貢獻較小。

  (2)改善用戶體驗。用戶體驗是衡量移動圖書館服務質量的重要指標,也是定位用戶需求的最終目標。Zhao等人[47]基于以愉悅喚醒主導情感狀態模型和人格五因素模型,為移動圖書館用戶情感體驗的測量提供了一種有效的方法,對圖書館優化移動服務質量具有重要的參考價值。Que等人[48]通過學術閱讀背景下的用戶對照實驗,對背景音樂對閱讀的影響進行了實證研究,發現聽音樂不會影響讀者的閱讀質量,且閱讀時聽自己選擇的背景音樂有助于保持積極的情緒,能夠為改善背景音樂相關的服務提供參考。

  (3)關注特殊群體。本屆年會從不同角度展示了對邊緣化和社會隔離弱勢群體的支持。Weir等人[49]關注重度視障用戶的需求,開發了虛擬現實個人圖書館環境,幫助重度視障者克服行動能力和閱讀理解能力的限制,獲得真實的閱讀體驗和閱讀感受。Xie等人[50]比較了盲人和視力正常用戶在使用數字圖書館(DL)進行初步探索時采用的策略類型,結果表明視力正常用戶專注于瀏覽DL內容,而盲人參與者專注于瀏覽DL結構,強調提供DL結構概覽和快捷訪問對非線性瀏覽的重要性。Han等人[51]關注殘疾人的健康與體育意識,提出了測定自走式輪椅坡度信息的方法,以提高輪椅使用者的活動能力。

  4.3用戶教育與信息素養———深入探索信息素養和數據素養的新方法、新模式和新挑戰

  在當今數據密集和信息豐富的環境中,數字學習對教育、就業和生活質量有著深遠的影響,數據和信息素養(DIL)是當代公民必備的關鍵素養。在本屆年會開展的“數據和信息素養”專題討論會[52]中,學者們介紹了近期為改善DIL教育所做的努力,以及中國信息素養的教育實踐和調查研究。黃如花教授以武漢大學“信息檢索MOOC”為例,闡述了中大型在線開放課程給DIL教學帶來的機遇、挑戰和未來展望。BillyTakHolLeng教授詳細介紹了澳門大學開辦的博雅系列活動(BOYASeries),旨在通過圖書館舉辦的系列活動來推動信息素養教育。吳丹教授以COVID-19為背景,介紹了COVID-19疫情期間感染者和在治患者信息素養的調查研究,以及重大突發公共衛生事件中電子健康信息素養教育標準的適用性及對策研究。——論文作者:呂思妤吳丹

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频