發布時間:2020-02-08所屬分類:科技論文瀏覽:1次
摘 要: 摘要:文章通過利用高效快捷的光學字符識別技術,設計并實現了一種機車視頻轉儲分析系統。為了提高轉儲分析效率,系統首先對列車運行監控裝置(LKJ)文件預分析并提取關鍵數據,其次通過光學字符識別技術獲取視頻中附帶時間、司機、車次等信息,最終以時間為主
摘要:文章通過利用高效快捷的光學字符識別技術,設計并實現了一種機車視頻轉儲分析系統。為了提高轉儲分析效率,系統首先對列車運行監控裝置(LKJ)文件預分析并提取關鍵數據,其次通過光學字符識別技術獲取視頻中附帶時間、司機、車次等信息,最終以時間為主軸建立列車運行監控裝置文件和視頻文件之間的信息關聯。同時集成視頻轉碼功能以增強系統兼容性。實驗結果表明:系統有效提高分析效率。
關鍵詞:學字符識別技術;視頻轉儲分析;列車運行監控裝置
1概述隨著經濟的發展,近年火車不斷的提速,不僅提高了鐵路的運作效率,也縮短來來去去忙碌的人們在旅途上花費的時間,提高工作效率。然而,在我們的生活節奏不斷提高的同時,隨之帶來的安全問題和責任,也日漸加重。雖然目前國內的鐵軌交通中,實施了很嚴密的視頻監控系統[1-2],通過架設大量各種各樣的攝像機來監控各個場合,配合其他的安全措施,以避免意外事件的發生。但是現有的、傳統的監控系統也面臨著很大的挑戰。大量的視頻源和LKJ[3,4]文件通過人工監管的方式,進行監督和分析。在如此多的數據流當中,人的監管工作就顯得繁重而低效。視頻分析技術[5]作為智能視頻監控系統的核心技術,正越來越廣泛地應用于中國鐵路通信系統之中,為鐵路安全的監控提供了一種先進可靠的技術手段。
當前國內很多機務段車載視頻圖像的轉儲分析工作,是每天機車入段后,由技術人員取下視頻文件存儲硬盤,并做好相應標記(如車次、運行時間等),拿到數據管理中心進行人工挑檢分析并存儲,并將部分數據采用刻錄光盤方式保持。這種數據存儲方式,所需的硬盤和光盤數量巨大,管理難度較高并且數據分析耗時長,投入較多的人力物力且效率低下。
針對上述問題,文中設計并實現了一種基于光學字符識別技術(OCR)[6]的機車視頻轉儲分析系統。其主要特點是實現LKJ與視頻的同步分析展示。為了提高系統的智能化水平,系統中先對列車運行監控裝置文件預分析并提取關鍵數據,通過光學字符識別技術獲取視頻中附帶時間、司機、車次等信息,以時間為主軸建立列車運行監控裝置文件和視頻文件之間的信息關聯,并集成轉碼功能以增強系統兼容性。
2OCR簡介
OCR(OpticalCharacterRecognition)是指電子設備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。OCR識別率主要取決于:掃描分辨率,不求最“高”,只求最“佳”。根據經驗,五號印刷體采用250~300dpi比較合適;字號比較大(四號以上),需要使用用150~200dpi;對比度:為了達到最佳的識別效果,對輸入稿件在掃描時的要求是清晰,使掃描文件黑白分明,有利于軟件的識別;偏斜程度:現在的OCR大都采用字模識別的方式,因此圖像如果有一定程度的傾斜,就會嚴重影響識別效果,一方面需要盡量擺正掃描文件;另一方面還需要使用軟件進行偏斜校正;圖片模式:一般對彩色模式識別很差,黑白模式的圖片識別較好;字體:印刷體識別率高,手寫體識別率很低,需要人工校正。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(IntelligentCharacterRecognition)的名詞也因此而產生。衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。
3系統介紹
系統分為四個功能模塊、兩個存儲庫。分別是:LKJ預分析模塊、視頻轉儲及分析模塊、關聯模塊,和業務模塊。存儲庫分為基礎存儲庫和視頻存儲庫,基礎存儲庫存放LKJ分析結果數據、用戶登錄數據和LKJ與視頻關聯關系數據等,基礎存儲庫存儲數據量較大,讀寫操作相對頻繁,對其性能要求較高。視頻存儲庫主要按一定的規則存儲視頻文件。
3.1LKJ預分析模塊
機車LKJ文件實時記錄機車位置、速度、管壓、工況、缸壓等機車實時狀態數據,類似于飛機的黑匣子,以二進制形式存儲于IC卡或其它可移動介質中,是判斷機車是否正常運行和故障排除的重要依據,分析機車LKJ文件是視頻分析室首要工作。由于機車運行過程中產生的LKJ數量較多且文件較大,普通分析系統[7]對LKJ處理效率較低,且比較繁瑣。
一般情況下,LKJ分析工作主要有三部分組成:LKJ下載、LKJ分析和LKJ分析結果曲線圖展示。LKJ分析耗時主要集中在LKJ下載和分析。傳統串行分析方式分析效率過于低下。
設計中采用多任務預分析機制對LKJ文件讀取分析,如圖1所示,每個下載任務中均集成預分析機制,相比于傳統的下載后分析機制,設計中采用多任務并發、邊下載邊分析的機制,實際實現中根據LKJ文件的個數,確定對應的任務數,分析后得到的關鍵節點,比如機車啟動時間、超速時間和位置等存入基礎粗出庫待后續處理,同時實時顯示各任務分析進度。機車LKJ分析軟件[8]一般以動態曲線圖的方式展現給用戶,相比于解析原二進制LKJ文件,加入預分析機制的LKJ曲線圖更加流暢平滑,用戶交互操作更加方便快捷。多線程機制能大幅提升系統分析效率。多線程無需跨進程邊界,程序邏輯和控制方式簡單,所有線程可以直接共享內存和變量等,線程方式消耗的總資源比進程方式好。但是,如果工作機制出現混亂或者線程工作狀態出現異常會引起災難性后果。LKJ文件以多個二進制文件的形式存儲于介質中。當多個線程同時讀取一個LKJ文件時,諸線程應能實時獲得其它線程的讀取進度和位置,當前線程使用“事件”實時通知其它線程自己工作進度。同時,LKJ曲線繪制線程需在分析線程分析完一定的LKJ數據之后才能啟動繪制,兩者為“生產者消費者”關系,系統中使用“信號量”結合“事件”,控制兩類線程間的同步和LKJ曲線繪制線程的數量。
3.2視頻轉儲及分析模塊
機車中視頻一般存儲于機車車載NVR中,機車運行結束由相關負責人取下硬盤,通過相關軟件轉儲到指定存儲服務器,由于同一機務段不同的機車所使用的軟硬件廠家不同且各個廠家之間互不兼容,所以,諸多機務段都存在多個軟硬件同時存在的情況,這勢必造成大量人員和時間的投入,造成浪費,且工作效率低下。為了解決這個問題,設計中為各個廠家視頻監控設備提供統一轉碼服務,加入轉碼功能的分析平臺,能擯棄各視頻廠家差異,對于用戶透明。從而減少人力物力的投入。
期刊推薦:《甘肅科技》是甘肅省科技廳主管、甘肅省科技情報研究所主辦的面向國內外公開發行的綜合性指導類科技期刊。設有決策參考、技術創新、信息技術、情報工作、研究與探討、建設科技、醫學研究、農林園地等欄目。
如圖2所示。首先,對所有接入系統中的機車視頻存儲設備,若其編碼方式非H264編碼,視頻轉碼模塊會為其解碼再編碼,使其為標準H264碼流,在解碼過程中通過OCR獲取一幀視頻流中附帶信息,如時間,車次,司機編號等,處理后的視頻文件存入視頻存儲庫,從視頻中提取的信息存入基礎存儲庫,等待與LKJ文件的關聯。如圖2所示。
系統中轉碼服務使用FFMPEG做基礎支持。轉碼服務主要分為:數據接口模塊、存儲管理模塊、轉碼算法模塊、數據處理模塊、控制管理模塊等。開源FFMPEG作為一款成熟的視頻處理工具,隨著視頻分析技術的發展,其用途越加廣泛。
3.3關聯模塊
機車事故分析定位或運行狀態查看,現階段主要手段是LKJ與視頻相結合的方式[9,10],F存系統主要問題是由LKJ信息定位視頻信息或者由視頻信息定位LKJ信息較麻煩,需由軟件操作者經過多次計算、拖放去完成。定位效率低下。
為了解決上述問題,研發信息匹配服務(如圖3所示),信息匹配服務以時間和車次為依據,自動關聯LKJ預分析結果和視頻中提取的信息,建立關聯后的記錄更新到基礎存儲庫,更新后的記錄支持的業務功能有:UI同步播放展示、由LKJ信息到視頻信息的定位或者由視頻信息到LKJ信息的定位。有效提高視頻分析或事件定位效率。
由于LKJ預分析結果與視頻中提取的信息信息量較大,頻繁的讀寫會影響視頻搜索效率。系統中只保留關鍵節點處的信息,比如行車過程中信號燈改變、機車進出站,速度有明顯變化等狀況下的信息。為了更進一步優化存儲效率,在基礎存儲庫中以時間、司機編號、車次等為索引列建立多列索引。多列建索引比對每個列分別建索引更有優勢,因為索引建立得越多就越占磁盤空間,在更新數據的時候速度會更慢。
3.4系統業務
系統設計的總體業務架構如圖4所示,總體分為輸入輸出兩部分,存儲庫左側為輸入部分,存儲庫右側為輸出部分。
輸入部分主要完成LKJ預分析,以及LKJ預分析結果與視頻關聯。輸出部分則為最上層與用戶交互的部分。分為多路視頻播放及控制、錄像轉儲、分析結果查看、關聯點播和異常報警。多路播放及控制用于事故原因查找或驗證,錄像轉儲是為保存事故證據而研發的類似于“證據上傳”的功能。關聯點播功能即同步展示LKJ曲線圖與視頻文件,異常報警:當LKJ中發現有異常信息時,即時向用戶提示異常,由用戶進行下一步處理。
4系統實現
為驗證方案可行行及性能,采用CS架構搭建系統架構,開發語言為C#和C++,OCR算法由公司團隊與中國科學院某研究所聯合研發,數據庫和視頻存儲庫采用Oracle+FTP,客戶端與服務端之間使用WCF通信。由于機車數據為保密數據,牽涉到公共安全,為保證數據傳輸安全性,所有需傳輸的數據由數據發送端使用MD5數據加密算法進行加密,數據接收方接到數據后按加密方反操作進行解密。系統部分界面如圖5所示。
為排除因實驗條件對實驗結果造成的影響,取同一班列車的LKJ文件和視頻文件分別在博飛轉儲分析系統V1.0和捷信安通兩款分析平臺做比較,列車運行時長約2.5h,各軟件參數對比見表1。
表2中“平均耗時統計”是對本次機車多次運行記錄多次分析后的平均耗時統計,從實際實驗結果可以看出,新設計分析系統在分析耗時方便有了很大的改善,與“博飛V1.0”相比,系統中加入了LKJ預分析機制和LKJ與視頻同步定位功能,所以分析效率有很大的提高,而捷信安通由于本身不支持多窗口播放,所以分析耗時最長。由于新平臺增加了視頻轉碼功能,減少多軟件來回操作的麻煩,兼容性較好,獲得用戶好評。
5總結與展望
文中設計并實現了一種機車視頻轉儲分析系統。通過LKJ預分析機制和LKJ與視頻的關聯分析提高了視頻分析[11,12]效率,并在軟硬件兼容性有了很大的提高,但也存在不足,比如LKJ與視頻的分析需機車完成運行后才能進行分析,為事后定位方式。下一步研究方向為:針對當前鐵路行業應用需求,開發離線及在線視頻智能分析系統[13,14]。一方面,在線智能分析系統針對在途機車在運行過程中,對司機的值乘行為、標準操作動作、呼叫應答等進行智能音視頻在線分析,同時結合前方路況實時視頻圖像、機車運行實時數據綜合判斷司機行為是否違規,并對違規行為進行在線提醒,降低行車安全事故發生幾率,同時有利于地面人員實施監控管理機車乘務人員。另一方面,離線智能分析系統用于滿足當前大量離線視頻文件的快速、準確分析,解決傳統視頻分析完全依靠人工操作模式。
SCISSCIAHCI