學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基于碼書關聯網絡的基音調制信息隱藏檢測

發布時間:2022-04-20所屬分類:計算機職稱論文瀏覽:1

摘 要: 摘 要 基音調制信息隱藏在進行基音預測時嵌入機密信息,可在低速率語音壓縮編碼過程中進行高隱蔽性的信息隱藏,文中試圖對該種隱寫進行檢測.文中發現該種隱寫將導致壓縮語音流中相鄰語音幀自適應碼書的關聯特性發生改變,文中以此為設計隱寫分析算法的關鍵線索.為了量

  摘 要 基音調制信息隱藏在進行基音預測時嵌入機密信息,可在低速率語音壓縮編碼過程中進行高隱蔽性的信息隱藏,文中試圖對該種隱寫進行檢測.文中發現該種隱寫將導致壓縮語音流中相鄰語音幀自適應碼書的關聯特性發生改變,文中以此為設計隱寫分析算法的關鍵線索.為了量化該種關聯特性,文中設計了碼書關聯網絡模型并基于該模型得到了對隱寫敏感的特征向量.最后,基于所得特征向量并結合SVM(SupportVectorMachine,支持向量機)構建了隱寫檢測器.針對典型的低速率語音編碼標準 G.729以及 G.723.1的實驗表明,文中方法性能 優 于 現有檢測方法,實現了對基音調制信息隱藏的快速有效檢測.

基于碼書關聯網絡的基音調制信息隱藏檢測

  關鍵詞 隱寫分析;低速率語音編碼器;基音調制信息隱藏;碼書關聯網絡;基音預測

  1 引 言

  信息隱藏,亦稱為隱寫術,是一種將秘密信息嵌入到載體中,使秘密信息難于被監管者察覺的技術,載體可以是 文 本、圖 像、語 音 以 及 視 頻 等 多 媒 體 對象.信息隱藏技術與加密技術的根本區別在于:加密技術使信息呈現為“亂碼”而隱藏了信息的內容;信息隱藏技術則更進一步,不僅隱藏了內容還隱藏了信息的“存在性”.與加密技術相比,信息隱藏技術由于可使信息不可察覺,不容易引起攻擊者的注意,從而減少了被攻擊的概率.由于上述特性,信息隱藏技術可完成某些加密技術無法達成的信息安全任務,例如:可避開監管的隱蔽通信、基于數字水印的版權內容保護、無須帶外通道的多媒體內容認證以及完整性驗證等.信息隱藏作為一種技術手段也很容易被犯罪分子所使用,例如,美國中情局認為,塔利班在組織美國“911”恐怖活動時,曾使用信息隱藏技術來傳遞指令和消息.

  語音是人類在日常生活中進行交流的主要通信媒介,這就決定了語音必然是一種重要的信息隱藏載體.特別是近年來,隨著 VoIP(VoiceoverIP)技術的高速發展———當前因特網中 VoIP年通話流量已超過千億分 鐘 量 級,以 VoIP 通信中的語音碼流作為載體的信息隱藏及其檢測技術日益受到重視,成為信息隱藏領域新的研究熱點[1].在 VoIP 系 統中,為節省帶寬資源,多采用基于按合成-分析法的線性預測編碼(AnalysisbySynthesis-LinearPredictiveCoding,AbS-LPC)方法的低速率編碼器.與簡單的基于最低 有 效 位 的 隱 寫 方 法 相 比,基 于 AbS-LPC低速率語音編碼器進行信息隱藏是一個極具挑戰性的問題,其原因是語音經過高壓縮比的低速率編碼后基本沒有冗余數據,很難找到對隱寫透明的嵌入位置.鑒于此,很多研究者對這一問題展開了研究.

  從現有的 文 獻 來 看,基 于 AbS-LPC 低 速 率 語音編碼器的信息隱藏方法根據嵌入位置的不同可分為3類.第1類方法主要利用 LPC合成濾波器進行信息隱藏[2-4],具體而言該類方法通過修改 LPC 濾波器系數的分級矢量量化過程進行信息隱藏;第2類方法主要利用音調合成濾波器即基音預測器進行信息隱藏[5-6],具體而言該類方法通過修改基音對應的自適應碼本搜索過程進行信息隱藏.上面兩類方法都是編碼過程中的信息隱藏方法,即將語音壓縮和信息隱藏進行集成的信息隱藏算法;第3類方法屬于編碼后的信息隱藏方法[7-9],該類方法通過修改編碼得到的壓縮語音碼流中的某些特定編碼元素達到信息隱藏的目的.

  在上述3類方法中,利用基音預測器進行信息隱藏時,通過對自適應碼書分組來調整基音的搜索范圍,雖然基音的搜索范圍被調整,但編碼器仍能在一定范圍內搜索有限制條件的最優值,這就使其能夠保持較好的合成語音質量.而且,由于合成分析過程的存在,搜索過程被修改引入的附加失真,會在后續過程中得到補償,因此這類方法引入的壓縮語音失真極小,具有很高的隱蔽性.

  在 VoIP 語 音 信 息 隱 藏 檢 測 研 究 方 面,見 諸 報道的一些檢測方法大多是在非壓縮域提取語音的某些特征進行檢測[10-12].這些方法并不能有效地檢測壓縮語音碼流中的信息隱藏,其原因是,壓縮域的信息隱藏在解碼的語音信號中引入很小的附加失真,因此在非壓縮域很難獲得能夠區分是否隱寫的特征.近期已有一些學者專門針對壓縮語音中的信息隱藏檢測問題開展了相關研究[13-15].最近,文獻[15]提出了一種低速率編碼器 G.723.1中量化索引調制(QIM)隱寫的檢測算法.該方法從壓縮域提取隱寫檢測特征,達到了很好的檢測效果,為壓縮媒體流中信息隱藏的檢測提供了一種新的思路.但該方法并不能用于檢測基音調制信息隱藏.

  基于自適應碼書分組的基音調制信息隱藏方法,利用基音預測本身就存在誤差,具有極高的隱蔽性,對其進行隱寫分析困難極大,迄今尚未有相應的隱寫分析方法見諸報道.現有的一些語音隱寫分析方法[10-15]也不能直接用于該方法的檢測.為此,本文擬對該種方法進行隱寫分析.

  2 基音調制信息隱藏

  基音預測技術是低速率語音編碼器中普遍采用的技術.基音調制信息隱藏利用基音預測存在誤差,通過對基音預測的結果進行微調達到信息隱藏的目的,對壓縮語音質量的影響很小[5-6].VoIP所使用的低速率語音編碼標準主要 是 G.723.1和 G.729,針對這兩種編碼器的基音調制信息隱藏都是通過改變自適應碼書的搜索范圍來實現的,但又稍有不同,下面將針對上述兩種主要的低速率編碼器分別介紹其基音調制信息隱藏方法.

  G.723.1編碼器對每個具有240個樣值的幀進行操作,這在8kHz采樣速率時相當于30ms,每一幀又被分為具有60個樣值的四個子幀.每幀計算兩個開環基音估計,一個對前兩個子幀,一個對后兩個子幀.開環基音 周 期 估 計 LOL 是采用感知加權的語音f[n]來計算的.

  由于語音清濁音切換等原因,基音周期檢測算法本身就很難達到精確,因此對基音預測的結果進行微調,對壓 縮 語 音 質 量 的 影 響 小.最 新 的 研 究 表明,使用上述方法進行信息隱藏后,對原基音周期的改變率低于3%,這 種 等 級 改 變 基 本 不 影 響 解 碼 合成語音的質量,具有極高的隱蔽性.這也導致了對該類方法進行隱寫分析具有較大的難度.

  3 隱寫檢測算法

  語音信號局部存在周期性,特別是濁音音素對應的語音片段,從圖1濁音音素“o”對應的語音片段可以非常清楚地看到這一點.

  通常濁音 音 素 的 發 音 時 間 在30ms~50ms左右,而在 G.723.1編 碼 器 中 基 音 預 測 的 子 幀 時 長 為7.5ms,在 G.729編 碼 器 中 基 音 預 測 的 子 幀 時 長 為5ms.因此如果相 鄰 子 幀 語 音 信 號 正 好 是 周 期 性 重復的信號,那么這些相鄰子幀基音預測所得的值應該是相同的.也就是說,相鄰子幀的自適應碼書參量具有關聯性.

  在典型的低速率編碼器 G.723.1和 G.729中,自適應碼書參量就是基音延遲和增益.基音調制信息隱藏時,基音延遲的取值將依據當前嵌入的秘密比特是0還是1,將其原來的取值調整為奇數或 偶數,這將不可避免地導致相鄰幀基音延遲的值發生改變,從而導致相鄰幀基音延遲的共生特征被破壞.因此,可以利用這種共生特征進行隱寫檢測.下面我們給出基于這一思路的隱寫分析過程.

  3.1 碼書關聯網絡模型的構建

  在低速率語音編碼器中,每個語音幀被分為多個子幀.如上文所述,語音信號具有局部周期性,因此不同幀的各個子幀的基音延遲具有關聯性,即幀間自適應碼書參量具有關聯性;此外,同一幀內不同子幀的基音延遲同樣具有關聯性,即幀內自適應碼書參量也具有關聯性.為了描述這種關聯特性,本文定義了碼書關聯網絡這一模型.本文引入的碼書關聯網絡是由頂點和邊組成的,頂點表示語音片段中的自適 應 碼 書 參 量 (為每個碼書參 量創建一個頂點),邊表示其所連接的自適應碼書參量之間的關聯關系.

  下面將根據幀內和幀間關聯網絡模型,針對兩種主要的 低 速 率 編 碼 器 G.723.1與 G.729,分 別 構建其幀內和幀間碼書關聯網絡.

  3.1.1 G.723.1碼書關聯網絡

  在 G.723.1中,基音預測的結果是用自 適 應 碼書滯后和差分自適應碼書滯后來表示的,壓縮語音碼流的參量中,ACL0和 ACL2為第0、2子幀的自適應碼書滯后,用7bit編 碼;ACL1和 ACL3為 第1、3子幀的差分自適應碼書滯后,用2bit編碼.在由 上述關聯網絡模型 構 建 G.723.1碼 書 關 聯 網 絡 時,為了去除關聯網絡中相關性較弱的頂點以及便于計算,制定以下規則.

  規則1. 不選擇兩個7bit編碼頂點之間的關聯關系.7bit編碼頂點的取值 范 圍 為0~127,那 么相鄰兩個 頂 點 的 組 合 關 系 有 16384 種.數 據 維 度太高,需要大樣本 量 才 能 反 映 出 其 統 計 特 性,難 于實用.因 此,不 選 擇 7bit編 碼 頂 點 之 間 的 關 聯關系.

  相關知識推薦:論文發表期刊真假辨別方法

  規則2. 任意兩個網絡 頂 點 之 間 的 時 間 距 離小于或 等 于 30ms.其原因是通常濁音音素的發音時間在30ms~50ms左右,很明顯,在30ms~50ms這個范圍內,網絡頂點之間的時間距離越大,周期性越不明顯.為了提高關聯網絡的準確性,我們選擇網絡頂點之間的時間距離小于或等于30ms.

  根據上面兩個規則,可以得到 G.723.1幀 間 和幀內碼書關聯網絡,如圖4和圖5所示.為了方便描述,我們將關聯網絡中的有向邊用a,b,c,d,e,f,g,m,n,p,q標定,見圖4和圖5.

  3.1.2 G.729碼書關聯網絡

  在 G.729中,基音預測的結果是用 基音延遲P1和 P2來 表 示 的,其 中 第 1 子 幀 基 音 延 遲 P1用8bit編碼,第2子幀基音延遲P2用5bit編碼.在構建 G.729關聯網絡時,制定以下規則.

  規則3. 不選擇兩個8bit編碼頂點之間的關聯關系.其原因是8bit編碼頂點的取值范圍為0~255,相 鄰 兩 個 8bit編碼頂點的組合關 系高達65536種,維度如此之高的數據其統計特性非常難于獲取,即很難觀察到其關聯特性.

  根據規則3,并將關聯網 絡 中 的 每 條 有 向 邊 用u,v,w,x標 定,可 以 得 到 G.729 幀間和幀內碼書關聯網絡如圖6和圖7所示.

  3.2 碼書關聯網絡的剪枝

  在上文 中,我們通過制定相應的規 則去除了關聯網絡中相關性較弱的頂點,從 而 得 到 了 兩 種低速率編碼器對應的幀內和幀 間碼書關聯網絡.但是,所得關聯網絡仍然過于 復雜而不便于量化定點間的關聯關 系.為 此,在 本 部 分 我 們 將 給 出 一種對關聯網絡進行剪枝的方法.經 過 剪 枝 處 理 的原始關聯 網 絡,將只保留幀內 和幀間關聯網絡中相關性最 強 的 頂 點,并 通 過 融 合 得 到 一 體 性 強 相關性網絡.以下將仍以兩種典 型的低速率語音編碼器 G.723.1 和 G.729 為 例,闡 述 關 聯 網 絡 剪 枝方法.

  3.2.1 G.723.1碼書關聯網絡的剪枝

  語音信 號 的 局 部 周 期 性,使 得 相 鄰 子 幀 的 自適應碼書 參 量 具 有 關 聯 性.因 此 可 以 通 過 比 較 基音延遲相 同 的 頂 點 的 數 量,選 出 幀 內 和 幀 間 關 聯網絡中相關性最強的頂點.定義 G.723.1相關性指數如下:

  4 實驗結果

  本文選擇 G.723.1和 G.729作為實驗測試所用的低速率語音編碼器,并采用文獻[5-6]給出的基音調制信息隱藏方法作為隱寫方法,進行了本文隱寫檢測方法的性能評估.文獻[12]是近年公開的比較有效的語音隱寫分析方法,被文獻[5-6]用于評估其算法性能,因此我們也將本文方法與文獻[12]給出的隱寫檢測方法進行了比較.

  為了闡明本算法具有較好的普適性,本文選擇不同發音人的多個語音片段組成語音樣本庫.所用語音片段樣本包含5種,分別是中文男聲(ChineseSpeech Man,CM),中 文 女 聲 (Chinese SpeechWoman,CW),英 文 男 聲 (English Speech Man,EM),英 文 女 聲(EnglishSpeech Woman,EW),每種語音樣本各包含1000個語音片段;第5種為上述4類樣本的 混 合(Hybrid),共 有4000個 語 音 片 段.每個語音片段時長為30s,采 樣 率 為8000Hz,每 個采樣點用16bit量化,用 PCM 格式存儲.

  為了評估訓練所得分類器的分類準確性,用上述5種語音樣本的隱寫和未隱寫的壓縮語音片段分別組成訓練樣本和測試樣本,每類樣本75%用于訓練,25%用于測試,并提取其特征向量.然后用訓練樣本的特征向 量 對 SVM 分 類 器 進 行 訓 練,用 訓 練好的SVM 分類器對測試樣本進行分類并計算分類準確率.同時,我們還評估了語音片段時長對隱寫檢測結果的影響.表1和表2給出了用本文檢測方法對5種語音樣本在9種時長下的隱寫檢測結果.

  文獻[5-6]采用了基于二階差分衍生梅爾倒譜系數(Derivative Mel-FrequencyCepstralCoefficients,DMFCC)特征的通用隱寫分析方法[12],對其隱寫算法的性能進行了評估.這種隱寫分析方法是近年來提出的比較重要的隱寫分析方法,能夠對多種語音隱寫算法達到較好的檢測效果.因此,為了更好的評價本文方法性能,本文做了兩種算法的對比實驗.使用相同的語 音 樣 本 庫,DMFCC 方法的隱寫檢測結果如表3和表4所示.——論文作者:李松斌1)賈已真2)付江云1)戴瓊興1)

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频