學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于水族文獻的計量分析與知識圖譜研究

發布時間:2019-04-16所屬分類:文史論文瀏覽:1

摘 要: 摘要:隨著科學技術迅速發展,學術成果呈爆炸式增長,挖掘論文的核心作者、識別高引論文、分析文獻主題變得日益重要。通過Python抓取中國知網1953-2018年間990篇水族文獻,基于文獻的計量分析方法挖掘出我國水族文獻的高影響力期刊、報紙及機構,分析水族領

  摘要:隨著科學技術迅速發展,學術成果呈爆炸式增長,挖掘論文的核心作者、識別高引論文、分析文獻主題變得日益重要。通過Python抓取中國知網1953-2018年間990篇水族文獻,基于文獻的計量分析方法挖掘出我國水族文獻的高影響力期刊、報紙及機構,分析水族領域高引論文、發文熱點時間及核心作者;基于知識圖譜的分析方法構建水族文獻核心科研群體及作者間的合作關系,并揭示出水族文獻的主題演化趨勢。實驗結果展示我國水族文獻的發展歷程、核心科研群體和高引論文,識別出水族文化、體育、音樂、醫學和水書五大主題的關鍵詞及歷年的主題演化趨勢,為水族文化的研究和進一步發展提供相關啟示。

  關鍵詞:水族文獻,計量分析,知識圖譜,高引論文,中國知網

情報科學

  隨著科學技術迅速發展,學術成果呈爆炸式增長,基于文獻的計量分析可以挖掘出一個研究領域的高影響力期刊和機構,識別出高被引論文的主題、出版社和核心作者;基于知識圖譜的分析可以構建文獻作者的合作關系,挖掘出核心科研群體,并揭示文獻的主題演化趨勢。水族是一個具有悠久歷史和古樸文化的民族,繁衍生息于貴州、云南、廣西等省份,擁有獨特的民族文化、風土人情和語言文字[1],具有重要社會歷史文化價值。

  近年來,學術界和社會媒體掀起了研究水族文化和水書的熱潮,1953年至今,中國知網共收錄水族相關文獻990余篇,涉及水族文化、水族體育、水族醫學、水族音樂、水書文字等主題。水族文獻作為水族文化和知識交流的重要載體,是水族相關的學術研究團隊或科研工作者貢獻的重大成果。這些學術成果將有效地推動水族學科和領域的發展,為進一步追蹤水族源流、研究水族文化變遷、保護和傳承水族文化提供相關啟示。

  傳統的學術成果研究方法是基于文獻計量學和科學計量學的方法,分析內容包括文獻的主題、地域分布、機構分布、核心作者、引文特點等。姜春林通過文獻計量歷時法對《科學學研究》做出全面的計量分析[2]。梁永霞等基于CSSCI的中國引文分析進行了可視化研究,展現引文分析領域的知識結構關系[3]。黃曉斌等統計分析我國情報學高被引論文,展示情報學的發展歷程和學科主題[4]。蔡文伯等通過計量分析方法研究我國民族教育文獻態勢[5]。

  王宗水等基于1998-2014年中國社會科學引文數據分析社會網絡范式的演化、發展與應用[6]。徐庶睿等利用引文內容進行主題級學科交叉類型分析[7]。近年來,國內外學者致力于通過數據分析與機器學習技術來研究學術文獻,基于社交網絡和知識圖譜的引文分析技術也被用來輔助科研工作者和管理者把握學科發展脈絡,挖掘主題關鍵詞和核心作者。羅雙玲等提出了基于半積累引文網絡社區發現的學科領域主題演化分析方法,并應用于“合作演化”領域[8]。馬文博等通過文獻計量方法和知識圖譜分析《經濟研究》近十年載文[9]。

  任曉松等歸納研究中國碳排放熱點演化與知識圖譜分析[10]。當前水族領域的研究更多的是采用傳統的查閱資料、現場考察及問卷調查等方法分析水族文化、歷史、習俗、水書內容,沒有采用計量分析方法和知識圖譜來研究水族文獻,缺乏對水族文化深層次的主題演化和科研群體發現的研究。

  針對這些不足,本文提出了一種基于計量分析和知識圖譜的水族文獻分析方法,一方面統計分析水族文獻的高影響力期刊、報紙及機構的基本情況,挖掘水族領域高被引論文、發文熱點時間及核心作者;另一方面通過知識圖譜構建水族領域核心科研群體及作者間的合作關系,并揭示出水族文獻的主題演化趨勢。本文的研究成果具有重要的理論意義和實用價值,對傳承與弘揚水族傳統文化具有重要意義,為水族文化的研究和進一步發展提供相關啟示,為后續的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。

  1研究方法和數據采集

  1.1算法總體流程

  當前科研成果的分析研究已經引起了社會和學術界的廣泛關注和重視,所涉及的領域包括引文分析、論文自動分類、主題挖掘、學術成果測度、論文知識圖譜構建等。本文主要是關于水族文獻的計量分析和知識圖譜研究。(1)調用Python、Selenium和XPath技術自動抓取中國知網水族領域的文獻共990篇。(2)對所抓取的論文信息進行數據預處理,包括數據清洗、數值提取、中文分詞、停用詞過濾等處理,這是數據分析的重要處理環節。(3)將預處理之后的文本數據轉換為特征詞矩陣,涉及特征提取和權重計算。(4)通過計量分析和知識圖譜方法研究水族文獻,包括水族高影響力論文、知識圖譜挖掘核心作者及科研群體、水族文獻主題挖掘及演化趨勢等。

  1.2數據說明及預處理

  本文數據集采用Python自定義爬蟲抓取中國知網CNKI水族領域相關的學術成果信息,包括1953-2018年共收錄的990篇水族領域的學術文獻,其中學術期刊論文662篇,會議論文106篇,博士論文7篇,碩士論文91篇,中國專利5篇,科技成果3個,報紙116篇,詳細信息如表1所示。所抓取的水族文獻共包括九個字段,包括文章標題、出版社、文獻類型、出版年份、下載次數、引用次數、作者、摘要和關鍵詞。

  在進行數據分析之前,通常需要對所爬取的信息進行預處理操作,包括缺失值填充、異常值處理、數據清洗、中文分詞、停用詞過濾等步驟,其目標是為了得到高標準、高質量的數據,從而提升分析的結果。接著從六個方面分析水族文獻,包括水族文獻的高影響力期刊報紙及機構計量分析、高被引水族論文計量分析、水族文獻的時間跨度分析、高引論文的核心作者分析、核心作者知識圖譜分析及科研群體發現、水族文獻主題挖掘及演化趨勢。

  2水族文獻分析及研究

  2.1高影響力期刊、報紙及機構計量分析

  本文將分析水族文獻的高影響力期刊、報紙及機構,所采用的指標是刊載成果數量、總引用數量、總下載數量、篇均引用數量和篇均下載數量。

  (1)引文期刊分析

  對水族學術期刊論文的計量分析,可以從宏觀層面揭示出刊載期刊及研究群體的力量分布情況,也在一定程度上挖掘出高影響力的期刊,它們對水族文化研究做出了重要的貢獻。其中《黔南民族師范學院學報》刊載論文數量最多,共刊載45次;《貴州民族研究》總引用次數最多,42篇論文共被引用203次;《人類學學報》篇均引用數量最高,刊載10篇論文,平均每篇論文被引用16.40次。

  (2)引文機構分析

  引文機構分析主要研究來自全國各大高校、各類研究所和圖書館等機構的水族文獻。本文根據畢業論文的第一單位進行統計分析。發表水族領域相關論文兩篇及以上的機構共16個,其中刊載水族論文數量排名前三位的分別是:貴州民族大學(共刊載16篇)、貴州師范大學(共刊載8篇)、貴州大學(共刊載8篇);論文被引用最多的四個機構是:貴州民族大學(共被引用32次)、貴州師范大學(共被引用24次)、云南大學(共被引用19次)、昆明理工大學(共被引用19次);論文被下載最多的三個機構是:云南大學(共被下載4193次)、貴州民族大學(共被下載3715次)、中央民族大學(共被下載2793次)。

  該結果表明大學是水族領域研究機構的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區;同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學、廣西民族大學等。

  (3)引文報紙分析

  報紙作為學術成果的組成部分,同樣對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內涵、水書藝術和遷徙漂泊的歷史。其中《貴州民族報》報道的水族領域文章數量、下載次數和被引用次數都是最多,分別為發表45篇、被下載633次和被引用2次;接下來是《黔南日報》報道了20篇,《貴州日報》報道了19篇,《中國民族報》報道了9篇。

  2.2高被引水族論文計量分析

  論文被引用頻次越高,說明論文的學術價值越高。本文研究的990篇水族學術成果共被引用2124次,平均每篇學術成果被引用2.15次。被引用次數最多的文獻類型是學術期刊和碩士/博士論文,其中學術期刊662篇共被引用了1869次,碩士/博士論文98篇共被引用了242次,二者共占總被引用次數的99.4%。

  全部10篇高引論文的被引頻次都是20次以上,是所有水族文獻篇均被引用次數(2.15次)的10倍。其中被引頻次最高的論文是李培春等在1994年發表在《人類學學報》上的“水族的體質特征研究”一文,被引頻次為82次;排名第二的是蘇和平所作,2004年發表在《貴州民族研究》上的“水族審美意識探源”,被引頻次為48次;隨后是孫志國等于2011年發表在《貴州民族學院學報(哲學社會科學版)》上的“水族非物質文化遺產保護的探討”,顧曉艷等于2006年發表在《中國體育科技》上的“傳統體育文化在水族山寨中的生存狀態——水族‘端節’賽馬活動的變遷”,兩者被引頻次均為38次。

  其中被引頻次前三位的分別是:陜西師范大學陳永娥的“黔南本土文化語文校本課程資源開發的研究”,被引用23次;云南大學尤偉瓊的“云南民族識別研究”,被引用18次;上海師范大學韋學純的“水語描寫研究”,被引用14次。

  這10篇論文主要分布于民族類、師范類、人文社科專業較強以及西南水族聚居區所在的高校,一定程度上反映了這類大學對我國民族文化研究的影響程度。

  3研究結論

  本文采用計量分析方法和知識圖譜方法研究中國知網的水族文獻,涉及1953-2018年共990篇水族領域的學術成果。研究成果如下:

  (1)通過對水族文獻的高影響力期刊、報紙及機構計量分析發現:①民族類和人文社科類的期刊對水族文化研究做出了重要的貢獻,如《黔南民族師范學院學報》《貴州民族研究》《人類學學報》等。②大學是水族領域研究機構的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區;同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學等。③報紙是學術成果的重要組成部分,對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內涵、水書藝術和遷徙漂泊的歷史,具有代表性的包括《貴州民族報》《黔南日報》《中國民族報》。

  (2)高被引論文期刊和機構主要分布于民族類、師范類、人文社科專業較強以及西南水族聚居區所在的高校。被引頻次前10位的學術論文的被引頻次都是20次以上,是所有水族文獻篇均被引用次數(2.15次)的10倍,這些作者是水族文化研究的核心力量,這一定程度上反映出高校對我國民族文化研究的影響程度。

  (3)通過水族文獻時間跨度分析展示了水族文獻研究的進程和不同年份的文獻分布情況。最早一篇論文發表在1953年,是凌慰民老師發表在《中國金融》的“少數民族地區的農貸工作不能違反民族政策”。被引用10次及以上的文獻共45篇,被引用5至9次的文獻共64篇,被引用2至4次的文獻共151篇,僅被引用1次的文獻共137篇。2012年被引用過的水族文獻最高,共45篇;2006年被引用的總頻次最高,為277次,其中10篇文章被引用頻次10次以上,為高被引論文;2004年單篇均被引用頻次最高,平均每篇論文被引用10.69次。

  (4)高引論文的核心作者分析采用發文量、被引頻次、篇均被引頻次三個指標評估核心作者,并挖掘出40位核心作者,其中余躍生發表了水族相關的文章23篇,被引頻次為174次,篇均被引頻次為7.57次;顧曉艷發表了水族文獻16篇,被引頻次為176次,篇均被引頻次11次;趙凌發表了水族領域的論文14篇,被引頻次為25次,篇均被引頻次1.79次。

  (5)通過知識圖譜構建了水族文獻作者之間的合作關系,挖掘出水族文獻的核心科研群體,形成了以余躍生、顧曉艷、趙凌、潘朝霖、何燕、吳昌學、劉世彬、單可人等學者為核心的學術研究團體。其中以余躍生為首的團隊以水族基因、水族醫學、遺傳學方向為主;以顧曉艷和王亞瓊為首的團隊主要研究水族體育、水族文化傳承;以何燕為首的團隊研究方向是水族醫學、水族基因、心血管疾病;以趙凌為首的團隊主要研究水族音樂和水族樂器;以潘朝霖老師為首的團隊主要研究水書、水族圖騰、水族祝詞;以張振江為首的團隊以水族村落、水族祖靈和民族語言為主。這些團隊主要來自于黔南民族醫學高等專科學校、黔南民族師范學院、貴陽醫學院、黔南民族師范學院、貴州民族大學、中山大學等機構。

  (6)通過LDA模型識別出水族文獻的五大主題(水族文化、水族體育、水族音樂、水族醫學和水書文字)及關鍵詞,并采用詞云展示了1953年以來水族文獻的主題演化趨勢,包括1953-1995年、1996-2000年、2001-2005年、2006-2010年、2011-2015年、2016-2018年中不同年份的水族文獻所研究的熱點主題關鍵詞。

  總之,本文的研究成果具有重要的理論意義和實用價值。該結果展示了我國水族文獻的發展歷程、高引論文、核心科研群體的研究熱點,指出了水族領域高被引論文的主要特征及影響,識別出水族文化、體育、音樂、醫學和水書五大主題的關鍵詞及歷年的主題演化趨勢,對傳承與弘揚水族傳統文化具有重要意義,為水族文化的研究和進一步發展提供相關啟示,為后續的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。

  參考文獻:

  [1]饒文誼,梁光華.關于水族水字水書起源時代的學術思考[J].原生態民族文化學刊,2009(4):90-93.

  [2]姜春林.基于文獻計量學歷時法引文的案例分析[J].現代情報,2005(10):140-145.

  [3]梁永霞,楊中楷,劉則淵.基于CSSCI的中國引文分析的可視化研究[J].情報研究,2008:34-38.

  [4]黃曉斌,張歡慶.我國情報學高被引論文分析[J].情報科學,2018,36(1):54-60.

  [5]蔡文伯,馬杰.我國民族教育研究文獻態勢的計量分析[J].民族教育研究,2014,25(2):138-144.

  [6]王宗水,趙紅,劉宇,秦續忠.社會網絡研究范式的演化、發展與應用——基于1998-2014年中國社會科學引文數據分析[J].情報學報,2015,34(12):1235-1245.

  相關刊物推薦:《情報科學》曾用刊名:(國外情報科學),1980年創刊,本著求實創新的理念,始終站在學科研究的前沿,全面反映學科發展的動態,著力突出刊物與時俱進的時代特征,抓住圖書情報界的研究熱點,刊發了一大批既有理論水平,又有學術影響的重要論文,及時反映了情報學、信息管理、圖書館學等諸領域的最新研究進展!肚閳罂茖W》主管單位:國家教育部,主辦單位:中國科學技術情報學會;吉林大學,國內統一刊號:22-1264/G2,國際標準刊號:1007-7634.

  

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频