發布時間:2021-03-25所屬分類:工程師職稱論文瀏覽:1次
摘 要: 摘要:為模擬駕駛員的跟馳駕駛行為,并考慮駕駛員不確定性和記憶效應,基于實車跟馳實驗數據,提出并訓練了一種基于長短期記憶(LSTM)神經網絡方法的車輛跟馳模型;谠撃P脱芯狂{駛員的記憶效應影響時長并進行交通仿真。結果表明:與同體積隱藏層神經元的
摘要:為模擬駕駛員的跟馳駕駛行為,并考慮駕駛員不確定性和記憶效應,基于實車跟馳實驗數據,提出并訓練了一種基于長短期記憶(LSTM)神經網絡方法的車輛跟馳模型。基于該模型研究駕駛員的記憶效應影響時長并進行交通仿真。結果表明:與同體積隱藏層神經元的前饋神經網絡比較,LSTM神經網絡的跟馳模型預測結果更加貼近觀測值且更加平滑,接近駕駛員的實際駕駛行為;駕駛員行為受當前環境及其前1.0~3.5s內的記憶影響;該模型能夠消散交通流中的擾動,模型具有較好的抗干擾能力和穩定性。
關鍵詞:交通信息工程及控制;跟馳模型;長短期記憶神經網絡;記憶效應;交通仿真
0引言
隨著我國汽車保有量提高,跟馳成為城市道路工況中最重要的工況之一,據跟馳模型的形式,可以將跟馳模型的研究分為兩種類型:數學分析模型和人工智能模型[1]。前者是數學式形式揭示跟馳工況中速度、車頭時距、加速度等之間的關系,如GHR模型[2,3]。隨著研究深入,跟馳模型引入了駕駛員偏好、注意力不集中等因素,模型復雜度提高,如考慮最大意愿加減速的Gipps模型[4]、引入期望車頭時距的Helly模型[5]、考慮駕駛員感知閾值的心理-生理模型[6]和智能駕駛員模型[7],以及引入模糊邏輯的跟馳模型[8]等。以上數學分析模型通過引入少量駕駛員特性更好地模擬跟馳工況,但跟馳行為是多種特性共同作用的結果,考慮多種特性的數學分析模型非常復雜,為克服這一問題,研究者將注意力轉向了人工智能模型。人工神經網絡方法是人工智能模型中應用較多的方法,它能基于訓練數據發揮其泛化能力反映多種駕駛員傾向,不必量化輸入模型,在跟馳模型方面有基于前饋神經網絡的一般狀態[9]和應急疏散狀態[10]的跟馳模型,以及引入特征聚類的改善神經網絡跟馳模型[11]等。
除了駕駛員偏好等因素,駕駛員的記憶也會對駕駛行為產生影響,考慮記憶的駕駛行為更接近真實情況[12];谠撍枷耄琗in等[13]通過引入速度記憶改進傳統非線性模型,考慮車頭時距記憶的跟馳模型[14,15]也被提出,Pei等[12]將記憶效應以伽馬分布的形式引入線性跟馳模型并分析了其穩定性。為了將記憶效應引入跟車模型,同時保留人工智能模型在考慮駕駛員多種特性的優勢,Huang等[16]采用了長短期記憶(Longshort‐termmemory,LSTM)神經網絡訓練跟馳模型,但該網絡屬于多個隱藏層的深度神經網絡,網絡結構復雜,目標參數較多,數據的流動邏輯不清晰。
為考慮駕駛偏好、駕駛員記憶等多種因素對跟馳的影響,本文構建了LSTM‐全連接層的神經網絡結構,基于道路實車實驗跟馳數據,訓練出結構簡潔、有記憶功能的跟馳模型,與前饋神經網絡比較預測結果,基于模型研究駕駛員的記憶效應影響時長,并分析了該模型的抗干擾能力和穩定性。
1數據采集與處理
1.1數據采集
真實道路實車實驗獲取的跟馳駕駛數據是研究駕駛員跟馳行為的基礎,本文選擇了一條雙向四車道高速公路,該高速公路正在擴建,其中有7km路段已完工但尚未開通,實驗中可避免其他交通影響,且路段線形良好,以此作為實驗場地進行跟馳駕駛。
實驗中前、后兩輛車上裝備設備采集道路環境信息和車輛狀態及駕駛員操作信息,其中攝像機采集視頻以回顧實驗中是否有異常狀況,慣性導航系統采集兩車速度和加速度,毫米波雷達采集跟馳間距,將數據整合統一為頻率10Hz。實驗共采集20名駕駛員的駕駛數據,其中16名男性,4名女性,均能熟練駕駛,年齡從25~50歲不等。實驗中前車駕駛員按照個人習慣穩定駕駛,后車駕駛員以舒適距離跟馳并及時反饋自身是否因前車速度過低有強烈的超車沖動或因前車速度過高有跟車困難。過程中前車速度具有波動性,后車的行為除對前車當前行為變化的反饋,也包含了駕駛員偏好和記憶等因素的影響。
1.2數據處理
本文為了研究穩定的跟馳駕駛行為,排除其他因素的影響,對穩定跟馳進行了定義,并根據定義篩選數據。為使提取的數據段確實屬于跟馳行為,HCM2000定義雙車道公路車頭時距大于5s時車輛為自由行駛狀態,前車狀態不會對后車產生影響,因此車頭時距小于5s。為保證跟馳穩定,研究表明[17]穩定跟馳過程中兩車的相對速度維持在±2m/s的范圍內,因此在篩選數據時對車速差條件進行相應限制。為避免兩車突然制動或加速造成兩車相對運動狀態的突然變化,避撞時間倒數TTCi的范圍取±0.05s-1[9];為使跟馳過程自然,期間駕駛員應不存在有強烈超車沖動和跟車困難的情況。
2基于LSTM神經網絡的跟馳模型
2.1LSTM塊結構
如前所述,基于LSTM神經網絡的模型具有記憶功能,該功能是由網絡中的LSTM塊提供的,圖1為LSTM塊的結構圖,由t-1時刻傳遞過來的單元狀態ct-1、輸出ht-1和t時刻的輸入xt共同構成LSTM塊的輸入數據,輸出數據為t時刻的單元狀態ct和輸出ht。LSTM共有3個門,分別是遺忘門ft、輸入門it和輸出門ot,其中遺忘門決定t-1時的狀態單元ct-1影響ct的程度,輸入門決定t時刻的輸入xt保留多少進入ct,而輸出門決定t時刻的狀態單元ct保留多少進入輸出ht,ct和ht再參與到t+1時的LSTM計算。
2.2LSTM神經網絡結構
駕駛員根據前車行為調整后車姿態,以維持相對安全穩定的跟馳過程。根據公認的基本假定[18],駕駛員在跟馳中試圖調節后車速度,與前車速度保持一致,GHR模型[3]則認為駕駛員還會考慮兩車間距調節車速,駕駛員在跟馳過程中追求連續穩定的速度變化,避免加速度突變,因此本跟馳模型考慮了前車車速vl、后車車速vf、后車加速度af、車速差Δv和車間距d。車頭時距、TTCi和前車加速度等也是在其他跟馳模型中經?紤]的參數,但實驗證明這些參數無法提高本模型的效果,因此不予考慮。
相關知識推薦:哪些交通期刊審稿快
與前饋神經網絡類似,LSTM神經網絡也要確定隱藏層神經元個數,它表現在LSTM權重矩陣的維度,神經元個數決定了訓練網絡需要確定的參數數量,也與網絡的聯想能力有關。設置不同LSTM神經元個數,訓練并測試樣本,樣本情況如表1所示,計算預測與觀測的后車速度vf和跟車距離d均方差(MSE),得到結果見表2。
由表2可知,神經元過多或過少時測試結果均不穩定。這是由于盡管神經元較少的網絡在訓練時容易找到正確的收斂方向,但對不同的樣本,無法保證充足的聯想能力;神經元較多的網絡需要訓練更多的參數,在收斂過程中更容易陷入局部最小值或不收斂。為獲得一個有充分聯想能力的穩定模型,根據表2結果將LSTM神經網絡的神經元個數設為10。
3跟馳模型結果討論
3.1跟馳模型訓練結果
選擇一段穩定跟馳數據段落作為訓練樣本,樣本長度為200,根據第2節設置的參數訓練LSTM神經網絡,選取一段速度范圍相近的數據段作為測試樣本。為了與前饋神經網絡的性能對比,構建一個包含一層隱藏層的前饋神經網絡,隱藏層神經元個數取10,訓練方法和參數設置與LSTM神經網絡相同。
樣本情況如表3所示,預測結果對比如圖3所示,LSTM神經網絡和前饋神經網絡預測結果與觀測值的均方差對比如表4所示。LSTM神經網絡對不同樣本的預測效果有所不同,但多數情況下,LSTM神經網絡的效果都好于前饋神經網絡,對個別樣本如編號3,前饋神經網絡的速度預測結果更加接近觀測值,但對距離的預測仍然不如LSTM神經網絡效果好。此外,與前饋神經網絡相比,LSTM神經網絡的預測結果普遍更加平滑,更接近駕駛員的駕駛狀態,這是記憶效應發揮作用的結果。
3.2記憶效應影響時長分析
根據2.1節對LSTM塊結構與計算流程的說明可知,LSTM神經網絡的記憶效應是通過單元狀態ct和輸出ht的傳遞實現的。在進行預測時,初始化c0和h0為零矩陣傳遞給網絡,此時的預測數據記為無記憶預測值。如t=0之前有數據,c0和h0為上一時刻傳遞過來的非零矩陣,此時的預測數據記為有記憶預測值。
由圖4可知,無記憶預測通過遞歸消解了零矩陣c0和h0對預測的影響,其值逐漸靠近有記憶預測值,在t=1.1s處趨于一致,因此可認為在該階段駕駛員除了受當前環境影響,還受前1.1s內的駕駛記憶影響,即記憶效應影響時長為1.1s。對多個樣本統計多個點的記憶效應影響時長(見表5)可知,記憶效應影響時長在1.0~3.5s內分布,即駕駛員在駕駛過程中的當前行為受前1.0~3.5s內的記憶影響。
3.3LSTM神經網絡跟馳模型的交通仿真
由于神經網絡具有復雜的非線性關系,難以進行相應的交通流穩定性分析[18],但是可以通過數值仿真來檢驗其抗干擾能力和穩定性。
4結束語
本文構建并訓練了基于LSTM-全連接層神經網絡的車輛跟馳模型,該模型具有記憶功能,與前饋神經網絡相比,LSTM神經網絡的跟馳模型預測結果更加貼近觀測值且更接近駕駛員的實際駕駛行為。駕駛員的記憶效應影響時長約為1.0~3.5s,即駕駛員當前行為受當前環境及其前1.0~3.5s內的記憶影響;贚STM神經網絡的跟馳模型能夠消散交通流中的擾動,模型具有較好的抗干擾能力和穩定性。受實車實驗數據和計算機硬件的限制,訓練的模型有速度范圍局限,未來應采集更大速度范圍的跟馳數據訓練并改進模型。——論文作者:孫倩1,郭忠印1,2
SCISSCIAHCI