發布時間:2022-04-27所屬分類:計算機職稱論文瀏覽:1次
摘 要: 摘 要:針對音頻載體在隱藏機密信息時,存在隱藏容量
摘 要:針對音頻載體在隱藏機密信息時,存在隱藏容量小、隱蔽性不高和魯棒性較差等不足,該文提出一種基于小波變換的音頻信息隱藏新算法。該算法利用人耳聽覺系統對語音信號的中高頻信息微小變化不敏感的特性,調節語音段小波變換的中高頻系數,進而改變每級小波變換高頻系數前后兩部分的能量狀態來隱藏二進制機密信息。首先測試隱藏深度、隱藏頻段和載體語音分段長度 3 個參數對載體語音質量和機密信息誤碼率的影響,選擇算法所需的最佳參數,然后測試算法的可行性和各項評價指標,最后對算法進行常見的 5 種攻擊測試。測試結果表明該算法能夠實現機密信息的盲提取;具有良好的隱蔽性和魯棒性,能夠抵御加噪、低通濾波、重采樣、重量化和回聲干擾等多種攻擊;具有較大的隱藏容量,且語音分段長度越短,隱藏容量越大。
關鍵詞:信息隱藏;小波變換;高頻系數;能量狀態
1 引言
信息隱藏技術是指將特定的信息嵌入到數字化的載體信息中,在隱藏信息內容的同時也隱蔽信息傳播這一行為,以保證密文不引起監控者的注意從而減少被攻擊的可能性[1],其核心技術是信息隱藏與提取算法。與加密技術相比,信息隱藏技術是隱藏信息的存在性,讓攻擊者無法發現,因此信息隱藏更為安全[2,3]。信息隱藏技術常以語音、文字或圖像等媒體類型作為宿主載體。由于圖像媒體具有較大的冗余空間,人們常使用圖像作為隱藏機密信息的載體,如文獻[4]提出一種基于分塊自適應壓縮感知的可逆水印算法,文獻[5]提出一種魯棒可分離的密文域水印算法。語音是人們最常使用的信息傳輸方式,是通信系統和互聯網傳輸中最主要的業務類型,因此研究基于語音的信息隱藏技術在保密通信、軍事情報、版權標記和隱私保護等多個領域具有重要的研究意義和應用價值[6,7]。但是由于語音信號冗余信息較少,且語音傳輸信道較為復雜,因此國內外針對以語音信號為載體的信息隱藏方法研究還較少[8]。
隨著移動通信系統和互聯網語音通信的快速發展,近年來更多的國內外專家專注于語音信息隱藏方法的研究,出現了較多的理論和文獻。文獻[9]提出了一種基于振幅值修改的音頻隱寫算法,隱蔽性較好。文獻[10]提出了一種基于多小波域的水印算法。文獻[11]利用人耳對音頻的采樣倒置不敏感的特性,通過倒置小波系數正負極性隱藏機密信息。文獻[12,13]提出基于離散余弦變換的語音信息隱藏方法。文獻[14]提出基于奇異值分解的音頻信息隱藏方法取得了較好的隱藏效果。通過對當前國內外音頻信息隱藏方法分析發現,音頻信息隱藏方法主要有空間域隱藏和變換域隱藏兩大類[15],其中變換域方法由于具有很好的透明性和魯棒性獲得了更多的應用[16],但目前大多數變換域方法還存在一些不足,如算法復雜度高或僅在隱藏容量、隱蔽性和魯棒性 3 項指標間獲得某一項指標的突破,當 3 項指標要求發生變化時往往無法通過調整算法參數來兼顧三者平衡。
本文提出一種基于小波變換的語音信息隱藏的新方法,該方法首先對載體語音進行低通濾波,然后進行多級小波變換,利用人耳對中高頻信息微小變化的不敏感,通過比較各級小波高頻系數的能量來隱藏機密信息。首先測試在不同隱藏深度、不同隱藏頻段和載體語音不同分段長度的情況下載體語音質量和機密信息誤碼率,選擇算法所需的合適參數,然后測試算法的可行性和各項評價指標,最后對算法進行常見的 5 種攻擊測試。實驗結果顯示該方法簡單易行,可實現盲檢測,具有較大的隱藏容量、良好的隱蔽性和較強的魯棒性,能夠抵御加噪、低通濾波、重采樣、重量化和回聲干擾等多種攻擊。此外,在實際應用中可調整算法參數平衡隱藏容量、隱蔽性和魯棒性 3 項指標要求。
2 信息隱藏與提取算法原理及參數選擇
2.1 信息隱藏原理
人耳所能捕獲到的語音信號頻率主要分布在 300~3400 Hz 的頻段范圍內,低于 300 Hz 的低頻信號和超出 3400 Hz 以上的高頻信號人耳往往難以捕捉。利用人耳聽覺系統對語音中高頻能量的微小變化不敏感這一特點可以將機密信息隱藏到載體音頻信號中。把語音信號按一定時長分段后,對每一段語音進行 r 級小波分解得到高頻段、中高頻段、中低頻段和低頻段等多個小波系數。把每一頻段的小波系數分為前后兩部分,按式(1)和式(2)計算前后兩部分的能量,根據機密信息的二進制值按式(3)、式 (4)和式(5)調整各級小波系數,得到嵌入機密信息后的系數。
2.2 信息提取原理
提取機密信息時,首先對攜密語音按相同的時長進行分段,然后對每一語音段進行 r 級小波分解,按式(1)和式(2)計算各段語音每一級高頻段系數 ( ) ' H s k 前后兩部分的能量 EQ' k 和 EH' k ( k = 1,2, , r )。最后按式(6)提取各級小波高頻系數中嵌入的二進制機密信息。
2.4.1 信息隱藏頻段選擇 語音信號經過 r 級小波分解后產生各個頻段下的小波系數,修改任一級小波系數對語音質量都會產生不同程度的影響。
圖1所示為經過3級小波(小波庫為db1)分解后, 4個小波系數在不同嵌入深度lk 下分別嵌入信息后載體語音SNR曲線對比圖(語音分段長度為20 ms)。圖2所示為在不同嵌入深度lk 下,從4個小波系數上提取的機密信息的誤碼率曲線對比圖(40 dB噪聲攻擊)。圖1和圖2顯示,小波系數的頻段越高,載體語音質量下降越少,機密信息隱蔽性越好,但提取的機密信息誤碼率也越大;頻段很低的系數嵌入機密信息后載體語音質量受損嚴重,但其系數上提取的機密信息誤碼率幾乎為零?梢,載體語音質量和機密信息提取誤碼率是一對矛盾,在最高頻和最低頻系數上隱藏信息都是不合適的,可選擇在中高頻和中低頻兩個系數上嵌入機密信息。
2.4.2 載體語音分段長度的選擇把載體語音分為 10 ms, 20 ms, 30 ms 3 種不同長度的語音段,按 2.1 節所述方法在第 2 級高頻系數上嵌入機密信息,測試語音分段長度對攜密載體語音質量和機密信息誤碼率的影響。
圖3 為不同語音分段長度下載體語音SNR 對比圖。圖 4 為不同語音分段長度下提取的機密信息 BER 對比圖(由于在 40 dB 以上的噪聲攻擊下算法的誤碼率為零,因此圖 4 結果是在 30 dB 噪聲攻擊下完成的)。圖 3 和圖 4 顯示,語音分段長度越短,攜密載體語音質量受損越小,提取機密信息的誤碼率越高。究其原因是因為語音分段長度越短,語音段前后兩部分能量越小,按式(3)修改的高頻系數變化越小,從而語音質量變化越小,但在白噪聲攻擊下提取機密信息的誤碼率越高。此外,語音分段長度越短,單位時間內嵌入的機密信息比特數越多,隱藏容量越大。
2.4.3 嵌入深度l 的選擇 圖 1 和圖 3 顯示,在嵌入深度lk 值為 1 時載體語音的信噪比最高,隨著lk 的逐漸增大,SNR 值變小,載體語音質量變差。圖 2 和圖 4 顯示,隨著lk 的逐漸增大,提取的機密信息誤碼率變小。
以上實驗結果表明,載體語音 SNR、機密信息 BER 和算法隱藏容量是一組矛盾,在實際應用中,應根據具體指標要求選擇合適的信息隱藏頻段、嵌入深度和語音分段長度。
3 基于小波變換的信息隱藏算法的實現
由 2.4 節參數選擇可見,選擇不同的信息隱藏頻段、載體語音分段長度和嵌入深度對攜密語音的語音質量、提取的機密信息的誤碼率以及算法隱藏容量都有不同程度的影響。根據 2.4 節的實驗結果,選擇以下參數測試算法的各項性能:(1)在經過 3 級小波變換的中高頻和中低頻系數上隱藏機密信息; (2)中高頻系數的隱藏深度 2 l = 2 ,中低頻系數的隱藏深度 3 l = 1.5 ; (3)語音分段長度為 20 ms; (4)載體語音:采樣頻率 16 kHz,量化位數 16 bit; (5)機密語音:采樣頻率 8 kHz,量化精度 8 bit。
3.1 信息隱藏算法步驟
(1)機密信息經過加密和編碼形成長度為L的二進制比特流 X xi i Lxi = << Ì { } ( ),0 , ( ) (0,1) ,將 X 分為奇偶兩組,每組二進制串前各添加 2 組 8 bit 全 1 的信息嵌入開始標記,二進制串后各添加 2 組 8 bit 全 0 的信息嵌入結束標記;
(2)載體語音經過低通濾波(通帶截止頻率 7 kHz,阻帶截止頻率 7.8 kHz,通帶衰減 3 dB,阻帶衰減 40 dB)后被分為 20 ms 長度的語音段C = { ( ), c j 0 } < (5)按給定嵌入深度l2 和l3 ,根據式(3)、式(4) 式(5)將奇數組機密信息嵌入到 H2 系數中,偶數組機密信息嵌入到 H3系數中,獲取嵌入后的高頻系數 2 ' H 和 3 ' H ; (6)根據嵌入信息后的各級系數進行小波逆變換,重構載體語音C' 。
4 實驗測試及結果分析
在無攻擊情況下按3.1節和3.2節所述步驟進行實驗測試。機密信息為一段時長 674 ms 的語音“南京”,載體語音為錄制的涵蓋中文男聲、中文女聲、英文男聲和英文女聲共 4 種類型的 20 條語音。
相關知識推薦:研究信息隱藏相關領域的論文文獻
4.1 算法隱蔽性與隱藏容量分析
在 20 條載體語音上隱藏機密信息,每條語音做 10 次測試,總共進行 200 次測試。實驗所得結果取均值列于表 1 中。其中 SNR1為載體語音的信噪比、 PESQ1為載體語音客觀評分值,SNR2為提取的機密語音信噪比,PESQ2為載體語音客觀評分值,BER 為提取的機密語音誤碼率,Cap 為算法隱藏容量。由于算法在每個長度為 20 ms 的語音段上隱藏 2 bit 機密信息,因此隱藏容量 Cap=2/20(bit/ms)=100 bit/s。表 1 結果顯示,載體語音具有較高的信噪比,且 PESQ 值在 3.8 以上,人耳基本感覺不到載體語音的細微變化,因此算法具有良好的隱蔽性和較高的隱藏容量。此外,不同語種的載體語音對語音質量和誤碼率略有影響。
4.2 算法可行性測試與分析
圖 5 為某段載體語音嵌入機密信息前后的波形對比圖(截取部分波形),由圖 5 以及表 1 中載體語音的 SNR1和 PESQ1實驗數據可見,載體語音波形圖和語音質量未發生明顯變化,說明算法具有較好的隱蔽性。圖 6 為機密信息提取前后的波形對比圖,由圖 6 及表 1 中機密信息的 SNR2, PESQ2和 BER 實驗數據可見,機密信息波形未發生明顯變化,且提取的 BER 值非常小,即算法能夠在保證載體語音質量的條件下隱藏機密信息。
4.3 算法魯棒性測試與分析
信息隱藏算法的魯棒性是評價算法性能的重要指標,把原始載體語音和攜密載體語音同步進行以下常見的 5 種攻擊測試,從被攻擊后的原始語音信噪比 SNR、攜密語音信噪比 SNR1、機密語音信噪比 SNR2、原始語音質量 PESQ、攜密語音質量 PESQ1、機密語音質量 PESQ2以及提取的機密信息誤碼率 BER 等指標評價算法的魯棒性,各項指標測試結果的平均值列入表 2。
(1)白噪聲攻擊:使用信噪比為 20 dB, 30 dB 和 40 dB 的白噪聲進行攻擊。
(2)低通濾波:兩種語音經過通帶截止頻率為 6 kHz 的 Butterworth 低通濾波器處理。
(3)重采樣:對兩種語音進行上、下兩種重采樣攻擊。上采樣:采樣率按 16-32-16(kHz)變化;下采樣:采樣率按 16-8-16(kHz)變化。
(4)重量化:對兩種語音進行升位和降位兩種重量化攻擊。升位量化:攜密載體語音的量化精度按 16-32-16(bit)變化;降位量化:攜密載體語音的量化精度按 16-8-16(bit)變化。
(5)回聲干擾:攜密載體語音加入 10 ms 的回聲干擾。
實驗測試結果表明:
(1)本文算法對白噪聲和低通濾波攻擊具有較好的魯棒性。在 40 dB 噪聲攻擊和低通濾波攻擊下,攜密載體語音具有較高的 SNR1值和 PESQ1值,提取的機密信息SNR2和PESQ2值較高,BER 值極小,聽覺效果良好,與文獻[10-12]相比具有更好的魯棒性能。在 30 dB 和 20 dB 噪聲攻擊下,原始語音和攜密語音質量都有下降,提取的機密信息 SNR2 降低,BER 值升高,說明較大的白噪聲攻擊對兩種語音質量影響都很大,原始載體語音即使未隱藏有機密信息其語音質量也受損嚴重?梢,本文算法對抗白噪聲和低通濾波這兩種攻擊具有較好的魯棒性。
(2)本文算法對上采樣和升量化攻擊具有較好的魯棒性,下采樣和降量化攻擊對算法魯棒性有一定影響。采樣改變的是語音采樣點的位置,量化改變的是采樣點的幅值。上采樣和升量化后采樣點位置和幅值基本無變化,所以載體語音質量非常好,提取的機密信息誤碼率較低。下采樣和降量化后采樣點數和采樣幅值變化較大,兩種載體語音的 SNR 和 PESQ 下降都較為明顯,但其 PESQ 值仍在 3.5 左右,提取的機密信息 BER 值略遜于文獻[10-12]。
(3)較小的回聲干擾對本文算法魯棒性基本無影響;芈暩蓴_在 10 ms 左右時,本文算法性能非常好,說明延時較小的回聲干擾對算法性能影響較小。
(4)本文算法的魯棒性在白噪聲、上采樣、升量化、低通濾波和回聲干擾 5 種攻擊下比文獻[10-12] 中所述算法優越。下采樣和降量化攻擊時魯棒性稍遜于文獻[10-12]中算法。 5 結論基于小波變換的信息隱藏算法根據機密信息的二進制狀態調節載體語音的各級高頻小波系數,從而改變語音段前后兩部分的能量狀態來隱藏信息,提取機密信息時通過對比語音段中前后兩部分的能量大小識別機密信息,無需原始載體語音,能實現機密信息的盲提取。針對具體的應用背景,可通過調節隱藏頻段、嵌入深度和語音分段長度 3 項參數平衡算法性能指標。實驗及分析結果表明,該算法具有較好的隱蔽性和魯棒性,能夠對抗白噪聲、低通濾波、重采用、升量化和回聲干擾等多種攻擊,在保證載體語音質量的條件下每一語音段內可實現 2 bit 的信息隱藏,且語音分段長度越小,小波分解級數越多,則隱藏容量越大。——論文作者:吳秋玲*①② 吳 蒙①
SCISSCIAHCI