學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于機器視覺的作物多姿態害蟲特征提取與分類方法

發布時間:2022-03-29所屬分類:計算機職稱論文瀏覽:1

摘 要: 摘 要:由于野外誘捕害蟲的姿態存在多樣性和不確定性,使得利用機器視覺進行害蟲的自動識別與計數仍然是一個難題。該文提出一種基于顏色和紋理等與形態無關的特征相結合和利用多類支持向量機分類器的多姿態害蟲分類方法。通過對目標害蟲圖像進行不同顏色空間特征、基于

  摘 要:由于野外誘捕害蟲的姿態存在多樣性和不確定性,使得利用機器視覺進行害蟲的自動識別與計數仍然是一個難題。該文提出一種基于顏色和紋理等與形態無關的特征相結合和利用多類支持向量機分類器的多姿態害蟲分類方法。通過對目標害蟲圖像進行不同顏色空間特征、基于統計方法的紋理特征和基于小波的紋理特征的提取,構建了 6 組不同組合的特征向量。將 10 階交叉驗證的識別率作為適應度函數值,利用遺傳算法對各組特征向量進行降維篩選。最后利用基于有向無環圖多類支持向量機分類器對多姿態害蟲進行識別和特征組選擇。結果表明,遺傳算法最多可以使特征向量維數降到原來的 38.89%,基于 HSV 三通道顏色圖像的小波紋理特征組在建模時間和平均準確率方面都表現最優,可以作為一種有效的多姿態害蟲分類特征選擇。

基于機器視覺的作物多姿態害蟲特征提取與分類方法

  關鍵詞:機器視覺;圖像處理;特征提取;害蟲分類;多類支持向量機

  0 引 言

  準確和及時的害蟲識別與計數是監測農業害蟲信息(發生種類、發生數量和發生時間)和害蟲預測預報的一個重要前提。依靠人工識別與計數昆蟲存在勞動強度大、非實時性和效率低等問題。近十幾年來,農業害蟲發生嚴重、蟲口密度大、發生種類多,加上中國農民植保知識缺乏、有經驗的昆蟲分類專家和基層植保人員較少,不能滿足當前害蟲發生監測的需求[1]。隨著圖像處理和機器視覺技術的發展,研究者們開始探索基于模式識別的害蟲自動分類與計數方法。

  張紅濤等[2-3]針對害蟲目標的二值化圖像提取面積、周長等形態特征,通過建立害蟲模板庫和隸屬度函數對害蟲進行識別分類,識別率達 86%以上,但未涉及害蟲姿態對識別的影響。張建偉[4]通過收集蝴蝶標本,設計了基于形態特征和顏色特征的 2 種蝴蝶自動識別系統。Watson 等首先將每類昆蟲中 23 只個體大小、姿態進行標準化處理以增強特征提取效果,然后利用數字識別系統對活飛蛾進行自動識別研究[5]。Wang 等在目級昆蟲開發了一個昆蟲圖像自動識別系統,收集了來自 9 目 225 種昆蟲圖像,人工將昆蟲位置放好,將不完整的、粘連在一塊昆蟲進行剔除,方便特征的自動提取[6]。邱道尹等設計了一種基于機器視覺的害蟲檢測系統,通過自動誘集并調整害蟲姿態,以提取出的周長、不變矩等特征,運用神經網絡分類器對常見的 9 種害蟲進行分類[7]。

  Wen 等[8-9]利用基于圖像的方法對果樹害蟲進行了基于全局特征和局部特征的害蟲識別,并指出害蟲存在多姿態,增加了害蟲識別的難度。呂軍等[10-11] 針對害蟲正面和反面 2 種姿態進行了基于模板匹配的多目標水稻燈誘害蟲識別方法研究,但是野外害蟲還存在其他姿態樣式(軀干正反、翅膀伸縮各異、傾斜)。在模式識別方面,近年來支持向量機(support vector machine,SVM)在農業圖像分析和處理中得到了很廣泛的應用[12-15],尤其是針對樣本集較小的情況下,分類效果比人工神經網絡(artificial neural network,ANN)更加有效[16-17]。而且針對多類識別問題,可以在標準二分類支持向量機的基礎上構建多分類支持向量機(multi-class support vector machine,MSVM)進行多類目標的分類。

  綜上所述,目前大部分研究都是基于害蟲標本在實驗室環境下進行特征提取與識別,這些方法和成果對野外誘捕的多姿態害蟲識別非常敏感,不具有很好的魯棒性。因此,本文從與形態無關的顏色、紋理等特征提取出發,進行特征組合的構建與篩選,提出一種基于多類支持向量機分類器的多姿態害蟲識別方法,以期為害蟲實時在線識別裝置開發提供依據。

  1 材料與方法

  1.1 圖像獲取

  所有的樣本于北京昌平小湯山精準農示范基地通過野外蟲情測報裝置獲取,包括粘蟲,桃蛀螟,棉鈴蟲,地老虎等 4 類成蟲。利用自主搭建的軟件控制拍照系統對圖像進行采集,拍照裝置示意圖如圖 1 所示,該裝置由 1 m3的密閉箱體、配有可調高度立柱的 40 cm×40 cm 白紙平板、日本尼康公司生產的 D90 數碼相機(焦距 18~200 mm,最大光圈 F3.5~F5.6)和 DVR-620D 雙色溫環狀光源等部分組成。

  試驗中光源功率為 40 W,色溫設置為 4 000 K,通過相機支架把數碼相機與 620 光源完美地結合在一起,調節相機焦距,立柱高度設置為 45 cm 時,害蟲處于最佳的拍照效果。每種害蟲采集 80 張,總共 320 張,4 種害蟲的姿態樣例如圖 2 所示。

  從圖 2 中可以看出害蟲姿態各異,形態特征與害蟲種類相關性不大。

  1.2 圖像預處理

  由D90 相機獲得的原始圖像大小為4 288 像素× 2 848 像素,不適合進行大批量的圖像算法處理。為了加快處理速度,只針對害蟲目標區域進行處理,利用自動裁剪程序,通過選取害蟲目標邊緣為起點,沿水平向右方向、垂直向下方向將采集到的圖像裁剪為 640 像素×640 像素大小的圖像,進行下一步的目標特征提取。

  1.3 圖像特征提取

  形狀、顏色和紋理是害蟲種類區分應用中常用的特征,單一的特征很難解決多目標的分類問題,多特征結合呈現更強的識別能力。另一方面,考慮到野外誘捕的害蟲姿態不固定,同一種害蟲形狀姿態存在差異,本研究主要針對害蟲多姿態圖像,提取顏色和紋理 2 類與形態無關的特征,并進行不同的組合,挖掘出最優的、且易于嵌入式平臺實現的特征組合。

  1.5 多姿態害蟲分類

  在樣本數不大的情況下,用很多提取的原始特征進行分類器設計時,不但計算復雜度大,而且會影響分類器的性能,因此需要在分類前進行關鍵特征的篩選。由于遺傳算法具有強大的搜索能力,可以在較短的時間內搜索到全局最優點,因此本文采用遺傳算法對提取的特征參數進行篩選與優化,剔除冗余參數和無關參數后,再進行分類。

  1.5.1 特征參數篩選

  將處理后的每類害蟲樣本隨機地進行選擇,按 3∶1 比例分成 2 組,分別用于訓練和識別測試。為了能夠比較不同特征組合的分類效果,隨機數只產生一遍,用于所有組合的訓練樣本選擇。

  利用遺傳算法(genetic algorithm,GA)分別對每組的特征向量進行降維處理,采用交叉驗證(cross validation,CV)意義下的準確率作為 GA 中的適應度函數值,本文的特征向量優化過程如圖 3 所示。

  1.5.2 多類 SVM 分類器

  標準 SVM 是針對 2 類模式識別問題而提出的,若要實現多類分類,就需要將多個標準 SVM 通過某種方法構造多類 SVM 分類器(multi-class support vector machine,MSVM)。目前構造 MSVM 的方法主要有一對多方法和一對一方法[21],其中一對一的方法包括基于投票的多類支持向量機(voting based MSVM,VB MSVM)和基于有向無環圖的多類支持向量機(directed acyclic graph MSVM,DAG MSVM)2 種方法。楊文柱等[22]研究表明一對一 MSVM,無論采用投票決策還是有向無環圖決策,其分類正確率都比一對多 MSVM 高。在分類精度相差不大的情況下,DAG MSVM 要比 VB MSVM 的實時性更強,更適合用于在線分類系統。這里使用 DAG MSVM 方法對 4 類多姿態害蟲進行分類研究,比較不同特征組合的分類效果。

  基于 DAG MSVM 的訓練過程如下:從訓練樣本中每次取出 2 類害蟲的所有樣本,標為類 1 和類2。然后將標好分類號的所有害蟲作為輸入樣本來訓練 SVM,得到相應的支持向量和相應的分類平面。當輸出 1,表示訓練樣本不屬于類 2;而若輸出−1,則表示該訓練樣本不屬于類 1。4 類害蟲,需要建立 6(k=4)個 SVM 模型。

  訓練模型建立后,需要對模型進行性能測試。 4 種害蟲種類的測試識別的遍歷過程如圖 4 所示。對于一個未知種類害蟲 x  的一條遍歷路徑如圖 4 中虛線箭頭所示。首先,經過根節點 SVM 模型“1/4” 進行分類,結果輸出為−1,表明它不屬于第 1 類;繼續經過右邊孩子節點“2/4”。最后被葉子節點 “2/3”分類,得出所屬類別為桃蛀螟。其實遍歷的過程就是一個累積投票過程,但是減少了需要分類的次數,加快了運算速度。

  2 結果與分析

  文方法基于 Matlab2009a 編程實現,其中標準的二分類 SVM 使用了支持向量機 Matlab 工具箱,SVM 參數 c,g 采用網格化尋優策略進行選擇。 PC 的處理器為主頻 3.20 GHz 的 Intel Core i5-3470 CPU。

  2.1 特征參數篩選

  在上述采集的 4 種害蟲圖像中,通過隨機選取 60 張圖像作為訓練樣本,訓練樣本總數為 240,利用遺傳算法進行 100 次的迭代,分別對 6 組特征組合進行自變量篩選,結果如表 1 所示。

  從特征向量維數變化來看,經過遺傳算法優化篩選后,除了第 4 組以外,其他組的輸出特征維數基本約為輸入特征向量維數的 1/2,第 6 組優化程度最高,優化后的參數比例只為 38.89%,第 3 組優化程度次之,第 4 組由于是灰度圖像的 3 個細節分量,可以說在分類識別上三者同等權重,識別相關性較大,沒有進行優化。

  從特征屬性上分析,第 1 組特征中,優化后特征均值所占比例達到了 62.5%,基于灰度共生矩陣的特征標準差被全部優化,說明統計紋理特征中的特征均值對害蟲分類的貢獻值較大;從第 2、3 組特征優化結果可以看出,各個顏色分量均值被保留,而且基于 HSV 和統計紋理相結合的特征組降維比率為 47.37%,小于基于 RGB 和統計紋理相結合的特征組降維比率,說明前者的參數之間相關性更大,優化效果更好,更加適用于害蟲分類;第 4 組特征沒有得到優化,說明參數之間不具有相關性,并且對分類的貢獻值相等。從第 5 組特征篩選結果分析可知,在優化后的參數集合中,R 通道的小波能量參數所占比例達到 54.5%,G 通道的小波能量參數所占比例為 27.27%,B 通道所占比例為最小。說明在基于 R/G/B 通道小波能量特征組的多姿態害蟲分類中,R 分量的小波能量參數貢獻值最大, G 分量次之,B 分量最小;從第 6 組特征優選結果可以看出,色調 H 和亮度 V 分量的小波能量參數所占比例相同,都約為 42.8%,大于 S 分量的小波能量參數所占比例,說明在該特征組合當中,H 分量和 V 分量的參數對分類的貢獻相等,并且大于 S 分量。

  2.2 識別分類結果

  本文利用隨機挑選的 240 個樣本(每種害蟲 60 個)訓練模型,80 個樣本(每種 20 個)進行識別分類測試。支持向量機分類器參數通過網格優化方法獲得,最優參數 c,g 分別為 11.3137 和 0.707107。表 2 為不同的特征組合、特征向量維數優化前后害蟲識別的平均準確率和建模時間,從表中可以看出,在識別準確率方面:除了第 4 組的平均識別準確率保持不變外,其他組合的平均準確率都得到了提高,而且準確率保持在 97%以上,尤其是第 6 組特征 F6 的識別率最高,準確率達到 100%,F2 和 F3 特征組合次之。第 4 組特征識別率保持不變和上述特征參數沒有優化保持一致。

  相關知識推薦:論文翻譯服務算學術不端嗎

  在建模時間方面:每組的建模時間都得到了優化,F6 特征組合縮短最多,優化后建模時間僅約為 8 s,縮短比例達到了 74.5%。排在第 2 位和第 3 位的特征組合分別是 F3 和 F1,特征組 F4 的建模時間沒有發生很大變化。在兼顧識別準確率和實時性 2 個指標的基礎上,利用 DAG MSVM 多類支持向量機分類器進行多姿態害蟲分類,F6特征組合是最好的特征選擇,F3 特征組合次之。這也說明利用 HSV 顏色空間特征結合紋理特征能夠達到更好的識別效果。

  從表 3 中可以看出,桃蛀螟害蟲基本上沒有發生假陰性(把桃蛀螟識別為其他害蟲種類)和假陽性(其他害蟲種類識別為桃蛀螟)的現象,從圖 2 中的桃蛀螟圖像也可以說明這一點,桃蛀螟害蟲翅膀上布滿了黑斑點,圖像紋理分布和其他 3 種害蟲沒有相似之處,具有更強的識別性;而粘蟲、棉鈴蟲和地老虎之間存在誤判的情況,且粘蟲和棉鈴蟲之間這種現象更明顯一些。以參數優化后誤判相對來說較嚴重的特征組 F4為例,將發生誤判的粘蟲圖像與極為接近的棉鈴蟲圖像進行對比,并且比較他們之間的參數向量,發現發生誤判的害蟲之間的參數向量非常相似。圖 5 所示為試驗中 2 張誤判為棉鈴蟲的粘蟲圖像和一張與上述 2 張粘蟲圖像相似的棉鈴蟲圖像,它們對應的 F4 特征組參數如表 4 所示。增加訓練樣本可能能夠解決這個問題,由于害蟲的姿態存在多樣性,要想減少相似害蟲的誤判,訓練樣本需要盡量包含更多的姿態。

  2.3 討論

  然而本文也存在一定的局限性,本文采集的樣本有限,訓練樣本中的害蟲姿態基本包含了測試樣本中的害蟲姿態,所以整體的識別準確率都比較高。但是由于野外采集的害蟲姿態遠不止這些,單從害蟲的某一視角去采集圖像,而且采集的圖像樣本不是很大的情況,獲取的害蟲姿態信息有限。下一步的工作是對同一只害蟲采集多個視角圖像,從而增加樣本的姿態樣式覆蓋率,提高野外應用的識別準確率。另一方面,本文研究的害蟲對象只有 4 種,當害蟲種類增多時,可能會出現更多的種間相似性,得出的結論需要進行進一步的驗證和擴展。

  3 結 論

  1)在不影響識別率的情況下,除了基于灰度圖像的所有小波能量特征組外,其他各組參數基本上都進行了大約 50%左右的優化,最多的達到了 61.11%。在特征屬性方面,統計紋理特征組中,優化后特征均值參數所占比例達到了 62.5%,說明其對害蟲分類的貢獻值比標準差參數要大。與 RGB 結合統計紋理特征組相比,HSV 結合統計紋理特征組參數之間相關性更大,優化效果更好,更有利于多姿態害蟲的分類;诓煌伾臻g三通道小波能量特征組優化對比可以看出,基于 HSV 空間的三通道小波能量特征組優化效果大于基于 RGB 空間的三通道小波能量特征組,說明在利用小波能量參數進行多姿態害蟲圖像分類過程中,采用 HSV 空間三通道特征組更佳。

  2)利用多類支持向量機進行目標害蟲分類發現,在平均準確率和建模時間兩方面,基于 HSV 三通道的 2 層小波分解能量特征組,效果最好,參數優化后的識別率達到了 100%,建模時間只有大約 8 s。所以相對比來說,基于 HSV 三通道小波特征結合有向無環圖的多類支持向量機分類器方法是一種最好的多姿態害蟲分類方法。

  本文的方法是針對采集到的有限的目標害蟲姿態樣本進行研究的,由于實際害蟲的種類數量和害蟲的姿態樣式遠不止這些,研究成果對實際精準的分類計數應用來講還需要完善,下一步的工作將從多視角圖像采集和多類害蟲進行擴展研究。——論文作者:李文勇 1,2,李 明 2 ,陳梅香 2※,錢建平 2 ,孫傳恒 2 ,杜尚豐 1

  [參 考 文 獻]

  [1] 姚青,呂軍,楊保軍,等. 基于圖像的昆蟲自動識別與計數研究進展[J]. 中國農業科學,2011,44(14): 2886-2899. Yao Qing, Lü Jun, Yang Baojun, et al. Progress in research on digital image processing technology for automatic insect identification and counting[J]. Scientia Agricultura Sinica, 2011, 44(14): 2886 - 2899. (in Chinese with English abstract)

  [2] 張紅濤,胡玉霞,趙明茜,等. 田間害蟲圖像識別中的特征提取與分類器設計研究[J]. 河南農業科學, 2008(9):73-75. Zhang Hongtao, Hu Yuxia, Zhao Mingxi, et al. Feature extraction and classification in the image recognition for agricultural pests[J]. Henan Agriculture Science, 2008(9): 73-75. (in Chinese with English abstract)

  [3] 張紅濤,胡玉霞,劉新宇,等. 農田害蟲實時檢測裝置的設計與實現[J]. 河南農業科學,2007(12):63-65. Zhang Hongtao, Hu Yuxia, Liu Xinyu, et al. Design and implementation of real-time detection equipment for farm pests[J]. Henan Agriculture Science, 2007(12): 63-65. (in Chinese with English abstract)

  [4] 張建偉. 基于計算機視覺技術的蝴蝶自動識別研究[D]. 北京:中國農業大學,2006. Zhang Jianwei. Automatic Identification of Butterflies Based on Computer Vision Technology[D]. Beijing: China Agricultural University, 2006. (in Chinese with English abstract)

  [5] Watson A T, O'Neill M A, Kitching I J. Automated identification of live moths (Macrolepidoptera) using digital automated identification System (DAISY)[J]. Systematics and Biodiversity, 2004, 1(3): 287-300.

  [6] Wang Jianning, Lin Congtian, Ji Liqiang, et al. A new automatic identification system of insect images at the order level[J]. Knowledege-Based Systems, 2012, 33: 102-110.

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频