發布時間:2019-06-14所屬分類:文史論文瀏覽:1次
摘 要: 摘要文章鑒于目前應急專家發現存在的問題,提出構建應急專家發現路徑融合模型。從融合介入時間節點將模型劃分為三個子模式:應急專家關聯資源整合在評估資源分布態勢的基礎之上,設計基于資源均衡度的路徑加權融合流程;應急專家特征融合引入工程化建模邏輯,
摘要文章鑒于目前應急專家發現存在的問題,提出構建應急專家發現路徑融合模型。從融合介入時間節點將模型劃分為三個子模式:應急專家關聯資源整合在評估資源分布態勢的基礎之上,設計基于資源均衡度的路徑加權融合流程;應急專家特征融合引入工程化建模邏輯,構建從特征選擇到特征關聯,再到特征融合的分析模式;應急專家發現結果融合在不改變原有發現渠道的同時,通過設計分面指標及分面排名融合算法,獲取各路徑推薦的綜合結果。結合典型場景及業務需求構建應急專家發現路徑融合模型,可為應急處置提供全面有效的智力支撐。不同融合模式的橫向比較還未進行深入探討與分析。
關鍵詞:應急決策,專家發現,特征融合,排名分析,資源均衡度
1引言
應急決策(CrisisDecision-Making)是一種非常規的、非程序化的決策,決策主體在有限的資源、人力、時間和信息等不利因素下,對突發事件態勢做出研判和快速行為的過程。與常規決策相比,應急決策具有決策目標動態權變、決策信息嚴重不對稱、決策環境復雜多變、決策步驟非程序化等特點。作為一種非結構化的決策,應急決策采用定量分析模型不易,因此專家咨詢法應用尤其廣泛。融合了專家群體的知識與經驗,應急專家咨詢法可最大程度地降低方案施行過程產生的風險,提升決策的質量,其鮮明特征體現在:參與應急咨詢的專家來源更分散,應急咨詢的質量很大程度上取決于應急專家發現的效率和效果,而傳統信息咨詢已行業化和規范化,其咨詢人員多來自機構內部。
從本質上講,應急專家發現是決策需求與專家特征相似度匹配的過程,匹配的前提是決策需求與專家特征的最終表達形式要一致。知識經濟時代,專業知識體系構成了領域內的知識共同體——專家團隊,但共同體中的專家節點總體上并不一定具有明晰的架構。這一方面說明研究正趨于集群化[1-2],另一方面也表明專家特征具有模糊性和時變性。
現有應急專家發現通常借助4類網絡:
(1)人際網絡。人際網絡是人際關系的總和,而人際關系是專家社會關系的重要組成部分。作為一個開放復雜的巨系統,應急管理具有多尺度、多變性、多主體和多因素的特征,需要大量不同領域的專家共同參與到決策咨詢中[3]。為領域內的應急任務發現專家,召集人憑借對領域環境的熟知還能應對?珙I域合作則要求更加合理的知識及人員組成結構,召集人僅憑主觀判定,在選擇專家時可能會造成一定誤差,這些誤差源自信息的不對稱[4-5]。
(2)文獻網絡。文獻網絡是文獻資源及其關系的總和,目前國內外圍繞它開發的較有代表性的系統包括:FacFinder專家搜索引擎[6]、SmallBlue專家搜索軟件[7-8]、科技咨詢系統[9-10]、專家檢索系統[11-12]、基于本體的專家定位系統[13]和C-DBLP(http://c-dblp.cn/)等。除此之外,各類文獻系統也已成為定位專家的重要途徑,目前國內三大學術數據庫(CNKI、萬方和維普)都有專家檢索入口,但數據量并不大,且專家信息組織偏重外部特征,對內容特征的揭示不深。
(3)組織網絡。通過電子政務等工程,目前應急管理各級行政部門很多建設了專家庫、專家名錄等結構化數據,但這些數據的采集往往依靠行政命令,缺少應急相關的客觀知識體系輔助,專家特征表達規范程度不高,存在一詞多義、異詞同義等自然語言問題,決策需求與專家特征的完全匹配將造成部分相關專家的漏檢[14],進而影響到應急決策咨詢團隊知識結構的系統性。除此之外,現有專家庫、專家名錄更新周期往往較長,直接影響到應急專家發現的全面性。
(4)開放網絡。開放網絡關聯到的專家資源數量大、質量參差不齊,且部分信息來源于文獻數據庫。這些資源多采用檢索模型來處置專家識別過程[15-16],開放網絡資源專家特征(如名稱、研究方向等)常以關鍵詞形式包括在非結構化或半結構化的文本中,需要采用文本分析方法獲取屬性數據。鑒于應急決策質量的高要求,從開放網絡發現的專家可信度仍需要進一步驗證,而可信度大小可作為結果相關度判斷的標準之一,為決策主體認可與否專家提供參考[17]。
現有四種專家發現路徑都各自存在一定的局限性:通過人際網絡發現專家不夠客觀,且不利于跨學科專家發現;通過組織網絡層層上報的專家特征表達不夠規范,且更新周期比較長,需要構建客觀知識體系進行規范;文獻網絡發現的專家多來自學術機構,覆蓋面不足,尤其是對“小眾專家”識別力度不夠;開放網絡關聯到的專家資源豐富,但質量差異明顯,需要設計資源可信度評測算法,以提升專家發現質量。鑒于應急專家發現基準路徑存在的問題,本研究提出應急專家發現路徑的融合模型。
2應急專家發現路徑融合模型概述
應急專家發現路徑融合模型以單一應急專家發現路徑分析為基礎,可采用“增量分析+逐步迭代”方式來進行路徑融合,也可應用元組織方法將各類路徑整合成特征關聯網絡。前者借鑒工程化設計邏輯來串聯應急專家發現各個環節,后者采用文本網絡化技術來構建由客觀知識聯系形成的異質網絡。兩者融合的策略與融合結果的表現形式都存在一定差異,這主要源于不同學科對融合內涵的認知不同:遵照應急專家發現系統開發模式,增量迭代模型強調將差異化的應急專家發現路徑轉換為統一的過程,基準發現路徑不展現在最終融合結果中。
元組織模型采用網絡科學方法解決信息組織問題,注重不同發現路徑的形式聚合,而非內容融合,最終融合結果包含基準發現路徑。兩種融合方式各有優劣,前者信息融合徹底,不存在對專家特征的誤讀,因為在逐級迭代過程中已經解決了不同路徑發現的同一專家特征間存在噪聲和沖突問題;后者嚴格上講只是以專家為連接點,將不同路徑發現的專家特征序列進行綜合展現。本質上講,后者是前者融合的基礎,兩者共同展現了信息融合的兩個不同層級:形式聚合與內容融合。本文將在上述融合模式分析的基礎之上,設計應急專家發現路徑融合模型,如圖1所示。,應急專家發現路徑融合可依照三類模式來展開:
(1)應急專家關聯資源整合。引言以應急專家關聯資源類型為分類標準,將應急專家發現路徑分為4類,這些資源共同組成了應急專家特征提取的語料集,應急專家關聯資源整合就是要把揭示同一專家特征的多源異構資源進行有機地整合,形成規范的未解析的應急專家發現數據集。
(2)應急專家特征融合。特征融合是在對不同分面資源解析的基礎之上,利用文本分析、統計分析等算法,識別并提取能夠表達應急專家特征的詞序列,常見的數學表達形式為特征詞向量。之后依據預定好規則對特征詞進行選擇,根據特征詞之間存在的客觀知識聯系,采用耦合分析建立基于特征關聯的應急專家網絡,進一步對該網絡進行社群結構識別,還可發掘知識相似或知識互補的專家群。
(3)應急專家發現結果融合。結果融合導向應急專家參與的典型場景及業務需求,通過突發事件分類與情景分析刻畫出應急情景特征,計算出應急情景特征與應急專家特征之間的匹配度,獲取不同路徑推薦的專家排名后,借助排名融合算法生成專家綜合排名,從而根據應急專家咨詢團隊人數及知識結構需求確認最終結果。
需要注意的是,上述三類模式的融合并非遞進關系,而是并列關系:資源整合是在資源描述形式統一的基礎之上,依據資源分布狀況與信源可信度,綜合確認不同資源在揭示應急專家特征的權重,采用加權計算方式獲取最終結果;特征融合是在對應急專家特征識別、提取和表達的基礎之上,添加特征關聯環節,構建“專家-特征-專家”的異質網絡;鑒于大規模在線數據更新給資源保管帶來了極大挑戰,結果融合強化從末端提升應急專家遴選的效率,引入分面排名融合算法來簡化大規模資源整合的難度。
3資源加權:應急專家關聯資源整合流程
應急專家關聯資源整合包括資源結構化處理、資源權重設計和基于資源均衡度的專家路徑融合三個環節,其中資源加權是資源整合流程設計的核心邏輯。各環節具體內容為:
(1)資源結構化處理。揭示應急專家特征的資源類型多樣,質量參差不齊,因此需要通過去重、清洗、合并等一系列規范化處理步驟進行預處理。同時這些資源還存在一詞多義、表意模糊等自然語言問題,因而需要引入客觀知識體系,以對資源語義進行合理映射和規范描述,結合元分析、主題分析等方法,將非結構的資源轉換為結構化的特征向量。
(2)資源權重設計。隨著應急專家對外溝通渠道的日趨多樣化,適用于專家發現的資源既包括傳統的學術文獻,還包括社交網絡資源和Web資源。不同渠道獲取的資源可信度存在著一定差異,如果不依據信源可信度對資源揭示專家特征的能力進行權重設置,可能會導致融合后獲取的應急專家特征出現較大噪聲。權重設定既可以依托專家經驗評估,還可以依據資源分布狀況。為避免主觀評價可能產生的隨意性,提出使用資源均衡度指標來設計資源權重。
4特征關聯:應急專家特征融合流程
應急專家特征融合流程包括特征選擇、特征關聯和特征融合,其中特征關聯是特征融合實現的關鍵。各環節具體內容表現為:
(1)應急專家特征選擇。突發事件處置的典型場景為應急專家發現指明了特定的業務需求,但無論哪一類需求都存在共性的特征選擇方法。特征選擇是從預處理好的特征向量中選取有意義的特征詞輸入到機器學習的模型和算法中進行訓練,選擇將重點依據特征發散程度和與需求的相關程度來綜合評斷。前者重點評判特征詞對樣本的區分程度,常見的測度指標為方差,其值越接近0,表明特征詞對樣本的區分程度越弱。
后者從預測分析角度計算特征詞與需求的匹配程度,常見分析指標包括相關系數法、卡方檢驗、互信息法等。同時為最大程度降低特征選擇的計算量,特征選擇還可建立在特征詞分類基礎之上,基礎分類維度可設計為三類:屬性特征詞、內容特征詞、上下文特征詞。屬性特征詞說明專家的基本信息,內容特征詞表達專家知識背景、研究專長及影響力,上下文特征詞說明專家應對突發情形的情景信息。
(2)應急專家特征關聯。揭示應急專家特征的語詞間存在著客觀的知識聯系,發掘并細化這種語義關系將為應急專家網絡的構建提供基礎支撐。常采用的特征關聯方法有:一是統計共現分析,提取應急專家特征向量共同包含的特征詞,以這些特征詞為連接點,構建“專家-特征-專家”網絡,進一步通過矩陣自身與其轉置的相乘,可獲取“專家-專家”網絡;二是語義內容分析,引入領域相關詞表,判別特征詞間的語義類型,建構當前特征詞間的語義組織網絡。
兩種特征關聯構建方法各有優劣,統計共現分析直觀易操作,但特征詞關聯的類型相對有限;語義內容分析能夠更為準確全面揭示語詞間的語義關系,但需要面向特定主題的詞表支撐。為兼顧統計數值計算和語義細化分析,現實應用中往往以統計共現分析所建立的矩陣為語義分析基礎數據,結合領域詞表、專家判定和機器學習算法對矩陣數值進行語義修正,進而服務于精細化的專家檢索及社群結構識別。
(3)應急專家特征融合。特征選擇只是特征處理的第一步,特征關聯也只實現了應急專家形式上聚合,后續將依據特征詞規模進行降維處理和融合分析。特征選擇必須要進行融合模型訓練,但受限于特征詞規模,模型訓練往往會導致計算量大,訓練時間長的問題,因此需要采用基于L1懲罰項的分析、主成分分析(PCA,無監督的降維方法)、線性判別分析(LDA,有監督的降維方法)等方法將原始的樣本映射到維度更低的樣本空間中,這將極大提升應急專家特征向量融合的計算效率。
設計應急專家特征融合方法的核心在于改進和組配現有數據挖掘、模式識別等典型算法及模型,最大程度降低特征疊加過程中產生的信息噪聲和消解不同資源提取特征間的沖突。從特征選取到降維,再到特征融合,這一系列分析共同構成了應急專家發現的特征工程,該工程既要強調特征在應急專家顯式表達過程的關鍵作用,也要保證各環節模型算法的效果和效率。
5排名推薦:應急專家發現結果融合流程
應急專家發現結果融合包括分面排名指標設計和分面排名融合兩個環節,各環節內容主要為:
(1)分面排名指標設計。結果融合最大程度地保留了原有的應急專家發現路徑,在無差別獲取應急專家集合的基礎之上,通過分面排名指標的設計,給出面向應急處置特定主題領域的專家排名。排名計算需要綜合的指標包括三個維度:一是專家個人分面,主要涉及與應急相關的個人基本信息,如機構、城市等地理信息,這將為基于位置鄰近的推薦提供基礎數據。
二是專家文本分面,主要涉及專家專長領域、專家研究主題、參與應急處置經歷等,專長領域與突發事件分類體系要緊密對照,專家研究主題要標記時間戳,以體現專家關注主題的遷移脈絡,應急處置經歷反映了專家實踐工作能力,配合應急處置效果評估,能夠最大程度簡化應急專家發現流程;三是專家影響分面,主要涉及傳統的學術評價和效果評價,學術評價關聯到專家發表作品的載體影響力以及引用擴散情況,效果評價強調理論研究成果的技術轉化情況、指導應急處置的效力等。
(2)分面排名融合。上述三個分面下都需設計定性與定量相結合的指標體系,這樣才能在突發事件情景分析的基礎之上,綜合給出不同分面下的專家排名。獲取的應急專家分面排名間可能存在一定沖突,必須設計沖突消解算法來進行分面排名融合。目前應用較多的排名融合算法是專家系統中的不確定性決策方法D-S證據推理[20-21],在之前研究中《應急參考咨詢團隊構建模式研究》[22]中,我們已對D-S證據推理模型在應急專家發現及團隊組建中的應用過程進行了系統分析和效果驗證。
除此之外,還可采用加權平均、TOP⁃SIS等算法對分面排名進行融合,最終目的都是為了獲取綜合排名結果,所以信息融合算法需要設計相對繁復的融合步驟,以消除分面排名間的不一致。分面排名融合效果評測指標可以選取排名值重復率和排名一致率:排名值重復率定義為專家分面排名值重復比例的均值,其值越大表明排名采納率越低;排名一致率定義為在不同分面排名下的順序一致的專家對數,其值越大表明分面排名兼容性越強。
6結語
目前應急專家發現路徑主要借助4類網絡,但每一類網絡都存在尚需完善的環節,借此本文試圖構建應急專家發現路徑的融合模型。從融合介入的時間節點,融合模型又被分為應急專家關聯資源整合、應急專家特征融合和應急專家發現結果融合。資源整合以權重設計為指導原則,根據揭示專家特征的資源分布態勢,可設計基于資源均衡度的路徑融合流程;特征融合以特征關聯為銜接紐帶,借鑒工程化建模思想,意圖設計從特征選擇到特征關聯,再到特征融合的一整套應急專家發現流程;結果融合在不改變既有應急專家發現路徑的基礎之上,設計分面排名指標,構建分面排名融合算法,寄期望從各路徑獲取一致性的推薦結果集。
資源整合和特征融合可通過構建應急專家庫來實現集中化管理,但在前期資源建設與特征工程設計環節需要投入較大成本;結果融合最大程度地保留了現有專家發現渠道,技術層面不存在較大問題,但需要注意應急專家發現與管理主體之間的組織協調。同時我們也注意到,目前信息融合方法的應用對象還多集中于社會化專家,較少關聯到應急管理領域,但相關研究方法對應急專家發現路徑融合模型設計具有很大參考價值。同時路徑融合各個環節都普遍設置了多類評測指標,為解決融合過程的噪聲和沖突,各融合模式往往借鑒和改造其他學科較為成熟的方法,改造后的融合結果總體來講都比基準方法效果要好,但改進后不同融合模式的橫向比較還未進行深入的探討與分析。
參考文獻
[1]WuchtyS,JonesBF,UzziB.Theincreasingdominanceofteamsinproductionofknowledge[J].Science,2007,316(5827):1036-1039.
[2]BörnerK,Dall’AstaL,KeW,etal.Studyingtheemergingglob⁃albrain:analyzingandvisualizingtheimpactofco-authorshipteams[J].Complexity,2005,10(4):57-67.
[3]范維澄.國家突發公共事件應急管理中科學問題的思考和建議[J].中國科學基金,2007,21(2):71-76.
[4]程少川,李高,鄭俊.面向跨學科創新合作的知識推送方法研究[J].情報學報,2013,32(2):148-153.
[5]李綱,葉光輝.基于模糊匹配的跨學科專家團隊發現算法研究[J].情報學報,2014,33(1):68-76.
相關知識閱讀:情報學報核心期刊征稿時間
《情報學報》是由中華人民共和國新聞出版總署、正式批準公開發行的優秀期刊。自創刊以來,以新觀點、新方法、新材料為主題,堅持"期期精彩、篇篇可讀"的理念。情報學報內容詳實、觀點新穎、文章可讀性強、信息量大,眾多的欄目設置,情報學報公認譽為具有業內影響力的雜志之一。情報學報并獲中國優秀期刊獎,現中國期刊網數據庫全文收錄期刊。
SCISSCIAHCI