學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

大數據背景下一類社會網統計性質的初步研究

發布時間:2020-03-04所屬分類:計算機職稱論文瀏覽:1

摘 要: 摘 要:在大數據背景下,文章實證地研究了一類合作競爭網絡的集群系數對頂點度的依賴關系,結果顯示兩者的依賴關系函數c(k)形式是多樣的,有指數形式、泊松形式和冪律形式。通過廣義合作網絡模型,在項目大小分布分別是指數分布、泊松分布和冪律分布的三種情

  摘 要:在大數據背景下,文章實證地研究了一類合作競爭網絡的集群系數對頂點度的依賴關系,結果顯示兩者的依賴關系函數c(k)形式是多樣的,有指數形式、泊松形式和冪律形式。通過廣義合作網絡模型,在項目大小分布分別是指數分布、泊松分布和冪律分布的三種情況下,數值模擬了集群系數對頂點度的依賴關系。得到的結果與實證統計的結果相同,即c(k)有指數形式、泊松形式、冪律形式及SPL等多種形式,并得出隨機選擇舊節點連接的概率p越大,所得網絡的集群系數對頂點度的依賴關系越遠離冪律形式,越接近均勻情況即指數形式或者泊松形式。

大數據背景下一類社會網統計性質的初步研究

  關鍵詞:集群系數;頂點度;實證統計;數值模擬;隨機概率

  0 引言

  復雜網絡,一個引起幾乎一切基礎學科和應用學科注意的熱門研究領域,開始于1998年。它的研究和發展以圖論作為重要基礎,圖論的大量知識在網絡研究過程中得到了廣泛的應用。之后,許多物理學家把統計物理學引入到復雜網絡的研究中,大家才知道,許多實際網絡的一些性質:例如集群系數(clustering coefficient)、度(degree)分 布 、平 均 距 離(averaged distance)等。

  頂點度(degree of a vertex),用k表示,是復雜網絡研究中的一個重要的統計性質。一般地,假設網絡中的一個節點i有ki條邊將它和其他節點相連,那么這 ki個節點就是節點 i 的鄰點。某一節點 i 的頂點度 ki,就定義為與該節點相連接的領點的總數,即節點的度表示為該節點的鄰點個數的總和。直觀上看,度越大的節點意味著它在某種意義上顯得越“重要”。

  集群系數(clustering coefficient),用 c 表示,是復雜網絡研究中的另一重要統計性質和概念。它表示網絡中某一節點的鄰點之間聯系的緊密程度。例如,在你的朋友關系網絡中,你的兩個朋友彼此間也是朋友的可能性大小。假設網絡中的一個節點i有ki條邊將它和其他節點相連,顯然,在這ki個節點之間最多可能有ki(ki-1)/2條邊,實際存在的邊數記為Ei。

  Erzsébet Ravasz 和 Albert-László Barabási 曾研究過復雜網絡的層次結構與該網絡集群系數對頂點度的依賴關系密切相關[1] 。他們提出,如果集群系數對頂點度的依賴關系函數c(k)是冪函數關系,即 c(k)~k-1,則表明該網絡具有層次結構。反之若c(k)不滿足冪函數關系,則該網絡無明顯的層次結構。通過實證調研,我們也發現很多實際網絡的c(k)并不是很好的冪函數關系,甚至有些實際網絡的集群系數與頂點度是無相關的[2-5] 。

  本文研究目的在于討論復雜網絡中集群系數與頂點度的依賴關系。接下來將極其簡要地介紹我們所研究的一些實際系統,以及這些實際系統的網絡構成,重要的是給出我們所研究的這些實際網絡的集群系數對頂點度的依賴關系。之后將給出我們廣義合作網絡模型的數值模擬結果,并對結果進行了粗淺的分析。最后將給出本文的一些簡單的結論,期望對復雜網絡的研究具有一定的價值。

  1 實證統計結果

  統計調研了10個實際系統。表1為這10個實際網絡的具體描述。圖1至圖10為10個實際網絡的集群系數與頂點度的依賴關系。

  2 模型數值模擬

  2.1 廣義合作網絡模型

  下面是我們在廣義合作網絡模型[8] 的基礎上,對模型作了一定的修改,然后通過數值模擬得到了數值結果。設初始t=0時有m0個頂點,已經聯接成若干個完全圖項目,它們的項目度hi0之和為h0。每步時間演化過程增加一個新頂點,然后,以一定的概率 p 隨機連接、以其余的概率(1-p)優選連接,選取T-1個舊頂點,把這T-1個舊頂點和這個新頂點(共T個頂點)中兩兩之間尚未連接的邊都連上,構成一個新的完全圖項目。共演化得到 5000 個項目,5000 個節點。我們對項目大小(T)分別為泊松分布、指數分布和冪律分布時的三種情況進行了數值模擬,結果將在后文詳細報道。

  2.2 數值結果分析

  下面是我們通過數值模擬得到的數值結果,圖11、圖 12、圖 13 分別為項目大小(T)為泊松分布、指數分布和冪律分布時,當網絡演化過程中新節點連接舊節點的選擇概率p取不同值時的情況得到的數值模擬結果。

  3 結束語

  本文對十個實際系統進行了實證統計調研,主要研究了這十個系統的集群系數對頂點度的依賴關系,通過我們的研究發現,這些系統的c(k)關系函數形式是多樣的,有指數函數、泊松函數等,甚至還有線性函數。為了能找出這些實證結果的合理解釋,我們通過廣義合作網絡模型進行了數值模擬。通過對模型數值模擬結果的分析比較,發現在網絡演化過程中,新節點選擇舊節點的隨機概率p越大,按照節點的項目度優選的概率(1-p)越小,演化所得網絡的c(k)關系越遠離冪律分布,越接近相對均勻的分布,即我們此處所述指數分布或泊松分布,而與網絡本身的項目大小分布是什么情況無關。

  相關期刊推薦:《計算機時代》(月刊)創刊于1983年,由浙江省計算技術研究所和浙江省計算機學會主辦,是《中國期刊網》、《中國學術期刊(光盤版)》和《中國核心期刊(遴選)數據庫》收錄期刊,全國發行,豐富的內容使您能夠自由的遨游在信息的海洋里,了解新技術,掌握新技術,享受精彩紛呈的數字生活。目前,設有:學術論壇、技術廣角、網絡天地、應用實踐、經驗技巧、信息安全、考試團地、市場縱覽欄目。

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频