學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于深度學習的竊電行為檢測方法

發布時間:2019-04-09所屬分類:科技論文瀏覽:1

摘 要: 摘要:相較過去大部分針對專變和公變的竊電檢測方法,文中針對群體數量龐大、竊電手段復雜多樣的低壓用戶進行竊電行為的檢測分析。首先建立特征工程,然后基于卷積神經網絡LeNet-5模型對日用電量數據進行建模分析,篩選出異常用電模式,再采用雙層深度網絡對

  摘要:相較過去大部分針對專變和公變的竊電檢測方法,文中針對群體數量龐大、竊電手段復雜多樣的低壓用戶進行竊電行為的檢測分析。首先建立特征工程,然后基于卷積神經網絡LeNet-5模型對日用電量數據進行建模分析,篩選出異常用電模式,再采用雙層深度網絡對用戶信息、臺區線損、告警信息等數據進行綜合分析。通過比對模型輸出的分級竊電嫌疑清單,本文方法對各類竊電模式有很好的查準率,為精確抓獲竊電奠定了基礎。

  關鍵詞:竊電行為檢測;深度學習;卷積神經網絡;全連接網絡;竊電嫌疑

計算機學報

  竊電問題一直困擾著供電部門。傳統竊電排查方法是由供電所防竊電人員人工觀察所轄區域的臺區線損、用戶電量等,根據行業經驗和業務規則,確定竊電嫌疑清單,再結合現場摸排來捕捉竊電行為[1-2],有諸多局限性。此外,當前的竊電檢測方法主要是采用計量裝置防止竊電,缺乏實時監控,檢測效果較差[3]。

  結合業務規則和機器學習算法,通過對智能電表穿透采集得到的數據進行全面的分析,從中尋找出存在竊電嫌疑的行為模式,成為一種新的方法[4-8]。相較過去針對專變和公變的竊電檢測方法,本文主要針對群體數量龐大、竊電手段復雜多樣的低壓用戶,對與竊電相關的因子進行梳理,建立特征工程,對日用電量的時序數據建立5層卷積神經網絡(CNN,ConvolutionalNeuralNetworks)模型,篩選出具有異常用電特征的模式,并輸出竊電嫌疑,再結合雙層全連接網絡對用戶檔案信息、臺區線損和異常告警信息進行綜合分析建模,按月度輸出竊電嫌疑清單[9]。

  1特征工程

  竊電分類模型以月度為周期,分析每個用戶當月的指標數據,評估其竊電嫌疑。通過對業務規則和經驗的梳理,將竊電指標分為以下四類:①用電量時序:日均電量、峰電量、谷電量;②用戶信息:行業分類(非居民用戶)、用電類別、城農網標識、合同容量、臺區容量、用戶數、歷史竊電數;③臺區線損:月均線損率、最低線損率、最高線損率、高損天數(線損率大于9%)、月均線損電量、最低線損電量、最高線損電量、線損采集成功率;④異常告警:電能表停走異常、電壓斷相異常、電流不平衡異常、電能表開蓋事件、反向電量異常。其中用電量時序特征數據為每天一項,一個月共31項,其余均為每月一項;位于相同臺區的用戶其臺區線損相同;異常告警是指當前月份過去三個月內的某類異常發生次數;以上指標均為每個人月一條,最終合并為建模數據。

  1.1黑白名單構造

  實際竊電用戶在所有用戶中的占比極低,因此竊電行為數據為非平衡集。黑名單可從國網各個網省公司下屬的各地區分局獲得,其來源是現場人員通過摸排和取證確定的竊電用戶。將用戶被抓獲的當月數據截取為黑名單,其余月份數據則丟棄。這是因為用戶可能在被檢測到之前的很長時間就開始竊電,而開始竊電的時間在客觀上未知的。白名單則難以確認,因為在每次排查后沒有記錄未竊電的用戶,且有的竊電行為具有時效性,沒有檢測到很可能是用戶及時隱藏了竊電證據。因此,白名單只能通過設定一些標準來大致篩選出來,以使得其中的黑名單噪聲盡量降低。根據過去經驗,線損長期保持高位的臺區更有可能存在竊電現象,反之線損健康的區域竊電則較少。參考國家電網對線損異常問題的考核標準,文中將單月每天線損率均小于9%的臺區中的用戶均劃定為白名單。

  1.2用電量時序處理

  線損指標雖然可以用來大致識別臺區的用電健康情況,但是仍然沒有辦法定位到具體的用戶。用電量(包括日峰谷電量)作為用戶用電合理或異常的直接指標,對于判斷任何方式的竊電都有指導性的作用。以日均用電量為指標觀察黑名單用戶的用電趨勢。在檢測竊電前后(受理時間),用電量呈現上升趨勢。這是因為在受理時間前后用戶從竊電狀態向正常用電狀態發生了轉換,用電量恢復了正常。而研究者希望模型能夠在竊電行為一發生就能夠檢測到異常,即從竊電狀態向正常狀態轉換的各種下降趨勢,這里的處理方式是將黑名單的用電時序進行翻轉。白名單不具有這種變化趨勢,則不需要進行翻轉。

  2模型構建

  2.1整體設計

  本文將竊電特征分為兩部分,其中用電量時序共包含93個特征,其余部分包含20個特征。對于前者,采用卷積神經網絡LeNet-5進行學習,輸出0到1之間的竊電嫌疑,然后將該中間值與第二部分的特征合并,再采用雙隱含層的全連接網絡進行訓練,輸出最終的竊電嫌疑系數[10]。受到采集終端或傳輸線路的限制,竊電指標數據中會存在一些漏采或錯誤的項。同時,白名單中也會不可避免混雜著竊電用戶。相比傳統機器學習算法,卷積神經網絡具有自動提取特征的能力,且對噪聲的抗干擾能力也更強,因此對有海量數據的非線性問題具有更強的泛化能力[11]。

  2.2卷積神經網絡

  將采集的電力數據轉換成CNN處理的格式。CNN是由美國神經生物學家Hubel和Wiesel首先提出的模仿人類大腦視覺原理的前饋神經網絡。它在圖像識別方面有著非常廣泛的應用,但通過配置,它也能在自然語言處理、時間序列預測方面發揮作用。CNN與普通的全連接網絡不同,引入了卷積層和池化層。卷積層用于提取特征,通過權值共享的方式工作,可大大減少全連接網絡的權值數量。

  卷積層包括若干個卷積核,與輸入層局部連接,用于掃描圖像或時序,每個卷積核都能從輸入中識別出不同角度的特征。池化層相當于濾波器,可對輸入進行降采樣,保留數據顯著特征的同時降低了結果的維度。CNN大大降低了全連接網絡的復雜性,因此對于存在位移的高維度時序數據有很高的效率。LeNet-5是由YannLeCun在1998年提出的一種結構簡單的CNN,它具有2個卷積層、2個池化層和3個全連接層,可用于高效地解決維度較少的時序預測問題。CNN包括輸入層,卷積層,池化層,全連接層和輸出層。

  3實驗與分析

  3.1模型配置

  本文采用深度學習框架DL4J(DeepLearningforJava)來實現深度學習模型。這是一套基于Java語言的深度學習工具包,可以高效地構建、訓練和部署各種深度網絡,同時支持GPU和Spark集成[12]。本文的DNN-2模型配置兩個隱含層,節點數分別為15和5。輸出層節點個數為2,輸出值為one-hot形式,兩個值分別代表樣本歸屬于正常和竊電類別的概率。LeNet-5的卷積核大小設置為3×1,通道數為3,分別對應日均電量、峰電量、谷電量三個時間序列。

  3.2實驗結果與分析

  實驗數據來源于福建省用電采集系統,包括福建省2015-2017三年的用電、線損和告警數據。經過清洗、篩選和歸一化后,共約90萬條。實驗一首先對樣本全集采用十折交叉驗證,訓練集和測試集比例為7∶3。實驗二以15、16年的樣本作為訓練集,17年的作為測試集,以驗證模型對未來數據的預測能力。最終模型輸出按照竊電嫌疑排序的分級清單,以及每級的竊電嫌疑下限,這樣方便業務人員根據不同竊電嫌疑級別采取不同的應對措施。

  模型的查準率也在下降,說明模型對有把握的樣本有更好的預測準確率,兩組實驗的Top100竊電查準率分別達到78%和83%。從效益和成本考慮,線上查準率一般需要達到20%以上時比較適合去現場巡查。實驗一的前6級結果符合需求,共檢測出565條竊電樣本,占測試集竊電總數的38.18%(查全率),綜合查準率為43.46%;實驗二的前6級共檢測出473條竊電樣本,查全率為33.43%,綜合查準率為36.38%。

  上述結果表明,本文方法對黑名單中30%~40%具有明顯竊電特征的樣本具有很好的判斷能力,但對于其它樣本的分析能力不強,這可能是由于黑名單訓練樣本不足以及白名單不可避免引入的噪聲,導致收集的竊電行為特征不夠豐富。實驗二與實驗一結果的差距較小,說明模型對跨年度數據仍然具有很強的泛化能力,排除了對相同年度數據過擬合的可能。

  4結束語

  本文針對低壓用戶的竊電行為,進行特征工程構建。結合兩種深度學習網絡,對用電量時序采用卷積網絡,對用戶信息、臺區線損、告警異常采用全連接網絡進行分別訓練。通過福建省三年歷史數據的實驗結果表明,模型精準定位了部分竊電用戶,相較傳統人為觀測或線下隨機摸排的方式,具有較大的改進。

  參考文獻:

  [1]王亞東,高巖,金鋒.智能電表數據分析及應用綜述研究[J].信息技術,2015,39(2):64-68.

  [2]曹敏,鄒京希,魏齡,等.基于RBF神經網絡的配電網竊電行為檢測[J].云南大學學報:自然科學版,2018,40(5):872-878.

  [3]青志明,張宏艷,龍漪瀾,等.基于載波異常監測的竊電行為判斷方法[J].科學技術與工程,2018,18(20):246-251.

  [4]劉盛,朱翠艷.應用數據挖掘技術構建反竊電管理系統的研究[J].中國電力,2017,50(10):181-184.

  [5]李端超,王松,黃太貴,等.基于大數據平臺的電網線損與竊電預警分析關鍵技術[J].電力系統保護與控制,2018,46(5):143-151.

  [6]曹崢,楊鏡非,劉曉娜.BP神經網絡在反竊電系統中的研究與應用[J].水電能源科學,2011,29(9):199-202.

  [7]周文婷,顧楠,王濤,等.基于數據挖掘算法的用戶竊電嫌疑分析[J].河南科學,2015,33(10):1767-1772.

  [8]張瑞.基于用電信息數據挖掘的智能反竊電研究與應用[J].價值工程,2016,35(35):51-54.

  [9]周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.

  相關期刊推薦:《計算機學報》雜志級別:科技統計源核心 北大核心 CSCD,主辦單位:中國技術經濟學會,周期:旬刊,國內統一刊號:11-4688/T,國際標準刊號:1671-1815。復合影響因子:2.906,綜合影響因子:1.528。

  

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频