發布時間:2022-01-22所屬分類:科技論文瀏覽:1次
摘 要: 摘要:機器學習(MachineLearning,ML),特別是深度學習(DeepLearning,DL),在 最 近 幾 年發展迅速,在數據挖掘、計算機視覺、自然語言處理、數據特征提取和預測等方面的應用中取得了令人振奮的進展。地震預測是復雜、涉及面廣、不成熟而且充滿爭議的科學問題;其發展
摘要:機器學習(MachineLearning,ML),特別是深度學習(DeepLearning,DL),在 最 近 幾 年發展迅速,在數據挖掘、計算機視覺、自然語言處理、數據特征提取和預測等方面的應用中取得了令人振奮的進展。地震預測是復雜、涉及面廣、不成熟而且充滿爭議的科學問題;其發展受到尚不清楚的地震機理和孕震結構、不完備的觀測數據與真偽不清的地震現象等方面的限制。但是,機器學習有可能改善復雜地震數據的挖掘和發現,推動地震預測科學的發展。本文回顧了機器學習在地震預測的應用,包括強震、強余震和巖石破裂失穩等方面的預測,并展望了機器學習在地震預測方面的研究趨勢。
關鍵詞:地震預測;地震前兆;機器學習;深度學習
引言
地震是世界上最具破壞力的自然災害之 一,其 直 接 和 次 生 災 害 會 導 致 巨 大 的 人 員 傷亡、心理傷害和經濟損失。減輕地震災害的主要途徑有兩種:一是進行地震場地的安全性評估和建筑設防等抗震準備,二是有效的地震預報或者震時非常短暫的地震預警。以1975年的海城 MS7.3地震為例,鑒于地震局系統對地震形勢的預測,政府下達了疏散命令,有效地降低了人員的傷亡[1];該地震因此成為有史以來為數不多成功預測的地震之一,也是歷史上毀滅性地震發生前唯一成功疏散大量人員的地震[2]。
然而,地震預測仍然是一門不成熟的學科,預測方法更多是基于經驗分析,而非物理機理。目前相對有效的方法有:識別顯著的地震前兆,或識別大地震發生之前的某種地球物理趨勢或地震活動模式[3]。地震預測通常被劃分為長、中、短臨不同的時間階段,短臨階段的地震預測往往和地震前兆密切相關,也是地震是否可以預測的主要焦點[4]。
持地震不可預測觀點的學者認為,地震是非線性隨機過程。1996年在倫敦召開的“地震預測框架評估”(AssessmentofSchemesforEarthquakePrediction)國際會議認為:地球處于自組織的臨界狀態,任何特定的小地震是否會演變成大地震取決于大量物理條件,而不僅僅是在斷層的附近;這種演變是高度敏感、非線性的,其初始條件不明,很難預測;難以精確地知道地震大范圍物理狀況的所有細節;因此,地震本質上是不可預測的[5,6]。震源孕育,無論是否達到失穩階段,都難以看到確定性的前兆[4]。
持地震可以預測觀點的學者認為,地震發生是有規律可循的,目前地震中長期趨勢判斷具有一定的可信度。同時,隨著對監測技術的改善、新方法的出現和地震機理認識的不斷提高,短臨預測最終可能實現[4]。20世紀60年代地震預測研究剛起步的時候,人們認為能找到一些作為“前兆”的物理量,這些物理量的“異常”變化達到一定程度往往預示著即將發生地震[7]。通過分析大量的觀測資料,地震前出現的異常非常復雜,僅有少數幾個現象被認為是可信的地震前兆[8,9]。
新技術的涌現可能改變人們對震前活動的認識,甚至發現更普遍的地震前兆。例如,海城地震前幾個月至幾小時的前震活動,被認為是可信的前兆[10];趥鹘y方法產出的地震目錄,只有約10%的主震存在前震。通過地震波形模板掃描方法,Trugman等[11]發現南加州72%的主震存在幾天到幾星期的前震序列,表明前震可能具有普遍性。因此,地震預測有可能在新技術的推動下獲得新的發展。
傳統的對于“前兆”的預測大多是經驗性的,往往憑專家的“直覺”。這些預測難以用清晰的、定量的物理圖像來描述,其意義是有限的[7]。假若要進行程序化表達,則需要建立一些預測模型。機器學習(ML)是人工智能的核心研究領域之一,通過對大量數據的學習發現其隱含的規律和特征信息,進一步理解事物本質,并自動做出預測或決策。借助大量的地震數據,機器學習方法可以提高對地震機理的認識,顯著改善地震預測的準確性。
本文首先介紹人工智能、機器學習和深度學習之間的關系,闡述了機器學習的分類方法及主要的發展進程。其次,回顧了利用機器學習進行地震預測的最新研究進展。最 后,展望了機器學習在地震預測領域的可能應用。
1 機器學習背景介紹
人工智能(ArtificialIntelligence,AI)是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門技術科學。人工智能研究的范圍非常廣,包括演繹、推理和解決問題、知識 表 示、學 習、運 動 和 控 制、數 據 挖 掘 等 眾 多 領 域。機 器 學 習[12](Ma-chineLearning,ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析和算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具有智能的根本途徑。深度學習[13](DeepLearning,DL,也稱為深度結構化學習)是機器學習領域中一個新的研究方向,是為了提高機器學習能力,更好地實現人工智能。三者的關系如圖1所示。
機器學習根據學習系統的“反饋”性質可以分為三大類:有監督學習,無監督學習以及強化學習(圖2)。有監督學習是通過已有的輸入、結果數據集(標簽數據),學習輸入至輸出的映射規則,主要用于分類和回歸。其中代表性的有 K 近鄰算法、決策樹、樸素貝葉斯、邏輯回歸和隨機森林等分類方法;線性回歸、多項式回歸和嶺回歸等回歸模型;還有可用于分類或回歸任務的支持向量機、神經網絡和梯度提升決策樹等模型。無監督學習需要從無標簽數據中學習到相應的表示或隱藏模式,主要 用 于 聚 類(如 層 次 聚 類、譜 聚 類、密度聚類和模型聚類等)和降維(如 主 成 分分析和自編碼器等)。強化學習是通過交互和反饋,在 價 值、策 略 或 模 型 的 迭 代 中 改進學習的過 程。機器學習的主要發展歷程如圖3所示。
從圖3可以看到,人工神經網絡(Arti-ficialNeuralNetworks,ANN)在機器學習發展歷程中具有重要的地位。ANN 是比較類似于大腦神經結 構 的 一 種 模 型,很 早 就用于機器學習。但早期的 ANN 是較為簡單的淺層神經 網 絡,表示復雜函數的能力有限,導致其在繁復的場景下泛化能力不足。隨著計算和 存 儲 能 力 的 大 幅 度 增 長,以 及開 源 學 習 框 架 的 推 出 (如 Tensorflow、Torch等軟件),可 以 很 容 易 構 建 出 更 多、更深層次的神經網絡進行深度學習,實現復雜函數逼近,提高泛化能力,深度學習也因此在最近幾年獲得全新的突破[13,14]。
2 機器學習在地震預測中的應用
2.1 機器學習地震預測的數據和方法
地震過程涉及地下物質物理或化學變化,震前現象復雜多變,如地震活動性、地表形變、電磁場、地溫、重力、地下流體和地球化學等。在眾多觀測數據中,地震目錄可能是目前比較可靠和相對完備的數據集,也是機器學習中最為常用的輸入數據。
地震目錄包含震級、空間和時間三個方面的信息。一般通過簡單的預處理或使用先驗地震規律對地震目錄進行轉換后,作為機器學習的輸入來訓練、建 模 和 預 測。如 Alarifi等[16]將地震的發生時間轉換為序號,地震的位置(經緯度和深度)以及震級轉換為預先劃分好的網格,用于訓練和預測。Panakka等[17]和 Adeli等[18]基于古登堡-里克特冪律(G-R關系)和特征地震模型兩個先驗統計模型,將地震目錄轉換為8個地震活動性參數作為指標(表1)。這些活動性參數甚至被演化為更多的地震參數,如 Asim 等[19]提出60個地震參數;也有部分研究僅用其中的一個或幾個指標[20]。
常規臺網產出的地震目錄通常只是離散地記錄了斷裂帶失穩破裂的信息,缺失更多微弱的或非常規的(如斷裂顫動、蠕滑等)斷裂帶活動。目前,基于模板檢測或機器學習在連續記錄的地震波形中發現了部分缺失的地震、顫動或慢地震,取得了顯著的成 效[11]。所以,直接挖掘地震波形記錄,可以獲得更豐富的地震活動信息進行預測研究。Rouet-Leduc等[21]通過實驗室聲發射(AE)連續波形數據,提取每個時間窗大約100個潛在相關統計特征(如均值、方差、峰度和自相關),然后遞歸選擇最有用的特征輸入。Ren等[22]在濾波器預處理后,將地震信號上的滑動時間窗口導出的特征作為輸入。馬士振等[23]輸入三分量地震波形提取地脈動特征。
其他類型數據用于模型訓練和預測目前相對較少。Corbi等[24]將94個描述模擬模型的表面變形特征作為輸入;Nicolis等[25]將研究區域內過去30d的強度函數的最大值作為輸入;DeVries[26]將主震周圍三維網格化的同震靜態庫倫應力變化作為訓練和預測的輸入。
可操作的地震預測/預報需要同時給出震級、時間和地點三要素的概率性或確定性結果;但大部分關于機器學習對預測的研究都把復雜的問題進行降維,只對震級、時間和地點三要素之一的單要素或其中雙要素進行預測。在實際應用中,這些要素還需要進一步對時間或震級離散化,或進行空間網格化,從而使預測簡化為分類或回歸問題。訓練和預測輸出結果一般為一個概率向量。在二分類地震預測任務中,輸出的發震概率與指定閾值進行比較,當預測概率高于閾值時,認為發生地震。
基于神經網絡的方法,特別是深度學習,對復雜問題表現出更優的解決能力,在地震預測研究中應用最為廣泛。Mignan等[27]對1994—2019年77篇有關人工神經網絡地震預測的研究文章總結發現兩個趨勢:一是近年來將人工神經網絡應用于地震預測的興趣逐漸增加,二是嘗試搭建更復雜的深度學習神經網絡去預測地震;跀祿寗拥臋C器學習模型涉及的輸入、輸出和架構如表2所示。
2.2 模型評價體系
建立合理的評估框架對于預測問題非常重要,有利于預測模型的性能評估和不同模型的對比?紤]到研究的初始階段和預測問題的復雜性,大部分研究把地震預測問題簡化成二分類問題,并通過混淆矩陣(ConfusionMatrix)進行評測,表3是四個基礎指標。
通;煜仃囍 TP與 TN 的數量越大,FP與 FN 的數量越小表示預測效果越好。但是混淆矩陣的數據很難衡量模型的好壞,因此從混淆矩陣又延伸出5個指標將矩陣轉化為0到1之間的比率(表4),以便于進行標準化的衡量。此外,由于受試者工作特征曲線(ReceiverOperatingCharacteristic,ROC)能給出比較穩定的評價,在工程應用中使用較多。ROC以假陽率為 X軸坐標,以真陽率為 Y 軸坐標,曲線 越 靠 近 左 上 角 則 說 明 模 型 算 法 性 能 越 好,其對角線對應于“隨 機 猜 測”模 型 的 性 能。ROC曲線下的面積(AreaUnderCurve,AUC)被用于衡量模型的算法性能。AUC值范圍為0~1,值越大模型算法的性能越好,其中值為0.5表示模型等價“隨機猜測”,為1時說明模型達到理想狀態。
2.3 不同情景的地震預測
地震序列中,主震突發性顯著,震級大破壞性強;攻克強主震預測,能夠顯著減少人員傷亡和降低經濟損失。但是強震,特別是針對某條斷裂帶的強震,面臨著地震復發周期長,可用于機器學習的數據樣本少等問題。在此情況下,發展余震或實驗室巖石破裂的預測,對地震預測研究也很重要。
余震預測研究具有更好的數據基礎和經驗模型約束。全世界范圍內余震占地震總數為30%~40%[28],可以為預測研究提供大量的訓練樣本。主震發生后,后續強震主要發生在余震區及周邊,現有的經驗定律可以很好地解釋余震的最大強度及其隨時間衰減規律和空間分布[29]。這些基礎將更有利于機器學習對地震預測研究的開展和改進。
小尺度的巖石破裂實驗可以分離斷層快速破裂或慢速蠕滑的影響因素,是識別地震主要機理的重要研究手段。相對于自然界的斷層破裂,在可控環境下的巖石破裂行為更為簡單。對巖石破裂的預測,也許可對預測天然地震指出方向,也可為預測方法對比提供參照基礎。
2.3.1 強主震預測
Alves[30]認為地震活動的混沌特性和經濟預測相似,受 此 啟 發 提 出 用 人 工 神 經 網 絡(ANN)進行地震預報。通常,對地震影響的評估可以采用地震震級或者強度。前者與釋放能量成比例,但有一個缺點:可用的數據序列只從20世紀開始,而要預測破壞性地震,需要研究相當長時間的跨度。因此,此文采用半定量的強度數據評估地震的影響(用 MMI表示[31])。將地震的時間、地點、MMI代入7個金融學上的數學計算表達式,計算預測趨勢并輸入人工神經網絡中,輸出為預測的時間、地點以及 MMI范圍,實現了輸入和輸出的一致性,且將輸出定量化。通過在葡萄牙亞速爾群島地區進行測試,該方法正確預測了1998年7月(MMI=8)和2004年1月(MMI=5)地震。雖然,此文對預測結果沒有進行系統評估,而且預測的地震烈度略有出入,但兩個震例預測的時間窗口都是準確的(±5個月內),表明了神經網絡在預測上的潛力。
Panakkat等[17]和 Adeli等[18]將地震預測問題描述為一個分類任務,目標是在指定區域內預測下個月最大震級。2007年Panakkat等[17]采用了前饋反向傳播神經網絡(LMBP)、遞歸神經網絡(RNN)和徑向基函數神經網絡(RBF)三種不同的方法對問題進行建模,在南加州和舊金山灣地區進行了訓練和測試?傮w而言,與 LMBP和 RBF相比,RNN 可產生最佳的預測精度。以此為基礎,2009年提出了概率神經網絡(PNN)并使用南加州地震帶的數據進行 了 測 試。結 果 表 明,對4.5~6.0 級 事 件 有 較 好 的 預 測 精 度,而 當 震 級 大 于6.0時,性能則表現一般。這兩篇文章的研究相輔相成,Adeli等[18]建議使用 RNN 預測大地震,PNN 預測中小地震。
Moustra等[32]通過使用不同類型的輸入數據來評估 ANN 在希臘地區地震預測的準確性。采用兩個不同的研究案例。第一個研究僅使用震級作為神經網絡的輸入,輸出為第二天的震級。預測的平均準確率為80.55%,大地震的準確率只為58.02%。第二個案例使用震電信號(SeismicElectricSignals,SES)作為神經網絡的輸 入。此案例又分為兩個部分,區別是如何構造缺失的SES。第一部分隨機構造,預測的準確率略高于60%;第二部分利用 ANN 構造數據,震級預測的準確率提升至83.56%。這說明了在恰當的數據上訓練模型的重要性。Alarifi等[16]基于多隱含層前饋神經網絡提出智能震級預測模型系統,在北部紅海地區如亞喀巴灣、蘇伊士灣和西奈半島進行測試。采用均方誤差(MAE)和平均絕對誤差(MSE)衡量不同方法的性能,結論為神經網絡模型比其他方法至少要好32%。
Cortés等[33]研究了機器學習在克羅地亞不同孕震區的震級預測性能,計算了精確率、靈敏度和特異性等評價指標,認為該技術可以很好改善預測效能。同年,Cortés等[34]探究了人工神經網絡(ANN)在東京及其周圍200km 區域中對于大地震震級預測的準確性。預測范圍設定為7d,使用了16個地震活動性參數。通過應用統計,發現人工神經網絡比其他方法有明顯的優越性。Cortés[20]等進一步應用四個回歸器(廣義線性模型、梯度提升機、深度學習和隨機森林)及其組合預測未來7d內最大地震事件的震級。研究發現,使用更復雜的回歸器組合具有最好的準確性。——論文作者:袁愛璟1,王偉君1,彭 菲1,閆 坤2,寇華東2
SCISSCIAHCI