發布時間:2022-04-12所屬分類:農業論文瀏覽:1次
摘 要: 摘 要 :目前 GenBank 數據庫共收錄 167 種直翅目昆蟲全線粒體基因組序列,涉及蝗亞目 9 個總科 22 個科 99 個物種,螽亞目 7 個總科 12 個科 68 個物種。在此基礎上,該文分析了直翅目昆蟲線粒體基因組的基本特征,概述了線粒體全基因組在直翅目昆蟲系統發育研究上的
摘 要 :目前 GenBank 數據庫共收錄 167 種直翅目昆蟲全線粒體基因組序列,涉及蝗亞目 9 個總科 22 個科 99 個物種,螽亞目 7 個總科 12 個科 68 個物種。在此基礎上,該文分析了直翅目昆蟲線粒體基因組的基本特征,概述了線粒體全基因組在直翅目昆蟲系統發育研究上的應用 ;同時基于線粒體全基因組序列重建了直翅目昆蟲的系統發育關系。主要結果如下 :(1) 直翅目昆蟲存在 8 種線粒體基因組排列類型,其中 trnK-trnD 重排現象僅發生在蝗總科中,trnN-trnS-trnE 重排現象僅發生在蟋蟀總科中,trnM-trnI-(-trnQ) 重排現象僅發生在擬葉蟲亞科中 ;(2) 直翅目昆蟲全線粒體基因組的堿基組成具有明顯的 AT 偏向性 ;(3) 不同的蛋白質編碼基因在直翅目昆蟲中的進化速率不同 ;(4) 支持直翅目以及螽亞目和蝗亞目的單系性 ;(5) 不支持沙螽總科單系性;(6) 支持蝗亞目各總科階元的單系性,且各總科間的系統發育關系為:( 蚤螻總科 + ( 蚱總科 + ( 䗛蜢總科 + ( 蜢總科 + ( 長角蝗總科 + ( ;瓤偪 + 葉翅蝗總科 ) + ( 錐頭蝗總科 + 蝗總科 ))))))。
關鍵詞 :直翅目 ;線粒體基因組 ;比較基因組 ;進化
直翅目 (Orthoptera) 隸屬于節肢動物門 (Arthropoda) 昆蟲綱 (Insecta),目前全世界已描述的種類有 27 941 種 (http://orthoptera.speciesfile.org/HomePage/ Orthoptera/HomePage.aspx)。直翅目昆蟲幾乎占據著整個地球上除極地以外的所有陸生棲息地,在生態系統中均發揮著重要的作用,有很多物種被作為解剖學、生態學、生物化學、生物聲學以及進化生物學等領域的模式生物 [1-6]。目前,國際上普遍認同將直翅目分為蝗亞目(Caelifera)和螽亞目(Ensifera),但有關亞目下高級階元的劃分仍然存在分歧 [7]。準確鑒定直翅目昆蟲種類,深入了解直翅目昆蟲的起源進化、系統發育以及種群擴張,對直翅目害蟲防控、經濟種質資源利用具有重要的指導意義。
昆蟲線粒體基因組為環狀雙鏈的共價閉合 DNA 分子,具有相對分子質量小、結構簡單、高拷貝、基因排列相對保守、基因進化速率快以及物種內幾乎不發生重組的母系遺傳特點,目前廣泛應用于昆蟲物種鑒定、分子系統發生學、生物地理學以及種群遺傳結構等領域的研究 [8-11]。近年來,隨著高通量測序的發展,科研人員獲得了越來越多的直翅目昆蟲線粒體基因組序列,為從基因組水平上研究直翅目昆蟲進化提供了良好的契機。
本文匯總了過去 22 年間直翅目昆蟲線粒體基因組測序的成果以及相關文獻,總結并比較了基因組大小、堿基組成、密碼子使用、基因進化速率、基因重排及特殊結構、RNA 基因及控制區的基本特征,并分析構建了直翅目系統發育樹,為系統研究直翅目昆蟲的分類及系統發生積累了基礎資料。
1 直翅目昆蟲線粒體基因組測序現狀
1995 年,Flook 等 [12] 發表了第一個直翅目昆蟲非洲飛蝗 (Locusta migratoria) 的線粒體基因組全序列。隨著測序技術的不斷發展,截至 2017 年 10 月 13 日,GenBank 數據庫共收錄 167 種直翅目昆蟲全線粒體基因組序列。其中來自蝗亞目的物種最多,共計 99 種,涉及 9 個總科 22 個科 ;來自螽亞目的物種共計 68 種,涉及 7 個總科 12 個科。其中本實驗室共提交 53 種 (31.74%) 直翅目昆蟲線粒體基因組,為重建直翅目昆蟲類群間系統發育關系,揭示直翅目昆蟲的進化過程提供了豐富的基礎分子資源 ( 附表 1)。雖然目前已獲得全長線粒體基因組的物種已覆蓋直翅目昆蟲的所有總科,但與龐大的直翅目昆蟲家族相比,測序的物種還微乎其微,例如怪螽科 Cooloolidae、癩蟋科 Mogoplistidae 和莫蜢科 Morabidae 等部分科級階元尚無代表物種。
2 直翅目昆蟲線粒體基因組基本特征
2.1 線粒體基因組大小
與大多數后生動物線粒體基因組相似,目前已測得的所有直翅目昆蟲全線粒體基因組均為閉合環狀雙鏈 DNA,并編碼 13 個蛋白質編碼基因、2 個 rRNA 基因和 22 個 tRNA 基因。其中粒體基因組最小的為 Hemicharilaus monomorphus[13],長度為 13 291 bp ;最大的線為纖細綠露螽 (Phaneroptera gracilis),長度為 18 255 bp。直翅目昆蟲線粒體基因組大小的變化,主要受控制區或基因組間隔區的數量和長度影響,例如疑鉤頂螽 (Ruspolia dubia) [14] 的控制區長度僅有 70 bp ;而基因組長度最長的纖細綠露螽除了具有一個長度為 1 548 bp 的控制區,在 nad2 和 trnW 之間還具有一個長度為 1 830 bp 的基因間隔區。
2.2 基因重排與特殊結構
根據基因位置和轉錄方向的變化,昆蟲線粒體基因重排可分為易位 ( 基因位置改變,轉錄方向不變 )、倒位 ( 基因位置不變,轉錄方向改變 ) 和基因洗牌 ( 多個基因發生易位和 ( 或 ) 倒位 ) 三種主要的類型 [15]。目前已測線粒體基因組的直翅目昆蟲存在 8 種線粒體基因組排列類型 :有 54 種直翅目昆蟲以圖 1-1 所示的典型的節肢動物門線粒體基因組方式排列,包括大多數螽亞目昆蟲 (50 種 ) 和極少量的蝗亞目昆蟲 (4 種 ) ;有 90 種直翅目昆蟲線粒體基因組中 trnK 與 trnD 基因發生易位,并以圖 1-2 所示的 trnD-trnK 方式排列 ( 也稱 KD 重排 ),該現象廣泛存在于除蚤螻總科和蜢總科的變色烏蜢 (Erianthus versicolor) [13] 以外的蝗亞目昆蟲中,而螽亞目昆蟲均無 KD 重排現象;有 9 種直翅目昆蟲線粒體基因組中 trnN、trnS 與 trnE 基因發生基因洗牌,并以圖 1-3 所示的 (-trnE)-(-trnS)-(-trnN)、(-trnE)- (trnS)-(-trnN) 或 (-trnE)-( trnS)-(trnN) 三種方式存在,該現象存在于所有的蟋蟀總科中 ;有 3 種直翅目昆蟲線粒體基因組中 trnI、trnQ 與 trnM 基因發生基因洗牌,并以圖 1-4 所示的 trnM-trnI-(-trnQ) 方式存在,該現象僅存在于擬葉蟲亞科 (Pseudophyllinae) 中 ;有 3 種直翅目昆蟲線粒體基因組中 AT 富集區、trnI、trnQ、trnM 與 nd2 基因發生基因洗牌,并以圖 1-5 所示的 trnI-trnM-nd2-AT-(-trnQ) 方式存在,該現象僅存在于露螽科的傅氏綠露螽 (Holochlora fruhstorferi)、長裂華綠露螽 (Sinochlora longifissa) [16]、四川華綠露螽 (Sinochlora szechwanensis) 中 ;鳴螽科的 Cyphoderris monstrosa[6] 線粒體基因組中 trnA 和 trnR 基因發生易位,并以圖 1-6 所示的 trnR-trnA 方式存在 ;螽斯科的三錐遲螽 (Lipotactes tripyrga) 線粒體基因組中 trnG、nd3、trnA、trnR、trnN 和 trnS 基因發生基因洗牌,并以圖 1-7 所示的 trnRtrnS-trnA-trnN-trnG-nd3 的方式存在 ;露螽科的污翅糙頸露螽 (Ruidocollaris obscura) [17] 線粒體基因組中 AT 富集區通過基因洗牌出現在 trnY 和 cox1 之間,并以圖 1-8 所示的 (-trnY)-AT-cox1 的方式存在。
此外有 4 種已測直翅目昆蟲中存在特殊的線粒體基因組結構,分別為錐頭蝗科的金瀾滄蝗 (Mekongiella kingdoni) [18] 缺少 trnR 基因,裂趾螽科的 Comicus campestris[6] 缺少 trnM 基因,劍角蝗科的 Locusta migratoria migratoria 和駝峰科的 Troglophilus neglectus[19] 在 cox1 和 cox2 基因存在 2 個 trnL?傮w來說,相對于膜翅目等復新翅目昆蟲 [20],直翅目昆蟲線粒體基因組重排事件相對保守,除了蝗亞目的 KD 重排,僅有 23 種直翅目昆蟲線粒體基因組存在特殊結構或發生了重排。目前,對基因重排現象的解釋主要有復制非隨機丟失模型、復制隨機刪除模型、重組以及由 tRNA 基因錯誤起始引起的復制 4 種解釋 [21]。在這些模型中,復制隨機刪除模型已經獲得部分證據的支持,但至今仍然沒有一種完美的模型可以解釋所有的重排現象 [22]。因此,對于高度重排的線粒體基因組可以用多個模型解釋,例如,對于僅發生 KD 重排現象的蝗亞目可以用復制隨機刪除模型解釋,而對于發生了基因洗牌的其他類型的線粒體重排現象就需要結合復制刪除模型及重組模型來共同解釋。
2.3 堿基組成與密碼子使用情況
已測的直翅目昆蟲全線粒體基因組具有明顯的 AT 偏向性 ( 附表 2),平均 A+T 含量為 73.31%,其中 A+T 含量最高的為蜢科的 Paramastax nigra[13] (78.00%),最低為優雅蟈螽 (Gampsocleis gratiosa) [23] (65.30%)。
對直翅目亞目及總科階元的全線粒體基因組的平均 AT 含量分析比較發現 :2 個亞目中,蝗亞目的 A+T 含量 (74.24%) 高于螽亞目 (71.95%) ;蝗亞目的 9 個總科中,葉翅蝗總科的 A+T 含量最高 (78.00%),而蚤螻總科最低 (68.80%) ;螽亞目的 7 個總科中,裂跗螽總科 A+T 含量最高 (75.00%),而原螽總科最低 (69.45%)。一般來說,同一科級階元中的物種間堿基含量變異較小,例如在蝗亞目中, A+T 含量在測序物種量最多的劍角蝗科 (SE=0.12) 和癩蝗科 (SE=0.15) 中呈現出明顯的穩態 ;但并非總是如此,例如在螽亞目中,測序物種量最多的螽斯科 (SE=0.48)、露螽科 (SE=0.33) 和蟋蟀科 Gryllidae (SE=0.63) 中,不同的物種間 AT 含量差異較大 ( 圖 2),類似的現象也出現在半翅目中 [22]。
除了日本紡織娘 (Mecopoda niponensis) [24]、傅氏綠露螽 (Holochlora fruhstorferi) [11]、四川華綠露螽 (Sinochlora szechwanensis)、黑角綠露螽 (Phaneroptera nigroantennata)、Tridactylus sp. 和 Mirhipipteryx andensis[6] 外,所有已測直翅目昆蟲線粒體全基因組的 4 種堿基含量均為 As>Ts>Cs>Gs,同時還呈現出較強的 A 堿基和 C 堿基偏好 (AT-Skew = 0.11, GC-Skew = -0.21)。直翅目昆蟲線粒體基因組呈現出的堿基組成偏好性與在進化的過程中突變、自然選擇、隨機遺傳漂變、水平基因轉移和基因組結構等多因素相互作用相關,導致線粒體基因組堿基含量A>T和C>G,堿基組成偏向于A和C兩種堿基[25],符合一般后生動物線粒體基因組 AT 正偏差和 GC 負偏差的特點 [26]。
對直翅目昆蟲亞目及總科階元的全線粒體基因組堿基組成的分析比較發現 ( 圖 3) :蝗亞目和螽亞目的堿基偏斜均符合后生動物線粒體基因組的普遍規律 ;蝗亞目的堿基組成偏斜最強烈 (AT skew = 0.15, GC skew = -0.18),螽亞目正鏈的 AT 堿基組成最為接近 (AT skew = 0.05, GC skew = -0.27);葋喣 9 個總科的堿基偏斜均符合普遍規律,除蚤螻總科正鏈的AT堿基組成最為接近(AT skew = 0.02)外,其余 8 個總科 AT 偏斜相對均很強烈,AT 偏斜范圍為0.11~0.23;其中䗛蜢總科的堿基組成偏斜最強(AT skew = 0.23, GC skew = -0.23),而蜢總科堿基組成偏斜最弱 (AT skew = 0.11, GC skew = -0.14)。螽亞目 7 個總科的堿基偏斜均符合普遍規律,且 AT 偏斜相對弱于蝗亞目,AT 偏斜范圍為 0.02~0.09 ;其中原螽總科的堿基組成偏斜最強烈 (AT skew = 0.09, GC skew = -0.29),蟋蟀總科 (AT skew = 0.08, GC skew = -0.28) 次之,而裂跗螽總科 (AT skew = 0.02, GC skew = -0.24) 最弱。
分別統計 167 種已測直翅目昆蟲線粒體基因組蛋白質編碼基因的密碼子使用情況,計算 2 個亞目的相對同義密碼子的使用頻率 (relative synonymous codon usage, RSCU),統計結果如圖 4 所示 :所有密碼子中,UUA(L) 在蝗亞目和螽亞目中的 RSCU 值均為最高,分別為 2.91 和 2.74 ;GCG(A) 在蝗亞目和螽亞目中的 RSCU 值均為最低,分別為 0.11 和 0.22 ;UGG(W) 和 AUG(M) 在蝗亞目和螽亞目中均無偏好性 (RSCU = 1) ;密碼子使用偏向性與密碼子第三位點的 AT 偏向性呈現出一定相關性,第三位點為 A 或 U 的密碼子使用頻率普遍較高 ;同一個密碼子的 RSCU 值在直翅目 2 個亞目昆蟲間無顯著差異。
2.4 直翅目昆蟲線粒體蛋白質編碼基因及進化速率
直翅目昆蟲的 13 個線粒體蛋白質編碼基因的 A+T 含量總體上略低于整個線粒體基因組(附表2)。
除脊蜢科,蛋白質編碼基因的第三個位點 A+T 含量遠高于密碼子第一、二位點,例如測序物種數最多的劍角蝗科密碼子的第三位點 A+T 含量高達 76.38%,而密碼子第一位點和第二位點僅為 73.85% 和 72.13%。
通過比較,直翅目昆蟲起始密碼子具有以下特點 ( 附圖 1) :atp6、cox2、cytB、nd3 和 nd4 的起始密碼均為標準的三聯密碼子 ATN (ATA、ATT、ATC、 ATG) ;cox3、atp8、nd1、nd2、nd4、nd5 和 nd6 的起始密碼子除了標準的三聯密碼子 ATN 以外,還有較特殊的起始密碼子如 GTG、TTG、AGT、TTA、 CTG 和 CCT ;編碼 cox1 基因的起始密碼子最為復雜,除標準的三聯密碼子 ATN 作為起始密碼子,大部分 cox1 使用了非標準密碼子,例如 CCG、CAA、 ATT、TTA、ACC、ACG 等,此外不規則的四聯密碼子 ATGA[27]、GTGA[13]、ATAA[12] 等都是可能的 cox1 的起始密碼子。這些特殊的起始密碼子可以減小基因間隔區,同時又避免相鄰基因發生重疊,同時可在轉錄成為 mRNA 后經過 RNA 編輯轉換成正常的起始密碼子并完成正常的翻譯過程 [22, 28]。
與起始密碼子不同,直翅目昆蟲在終止密碼子方面表現出較高的一致性 ( 附圖 2) :atp8 的終止密碼子為典型的三聯密碼子 TAA、TAG ;其余 12 種蛋白質編碼基因的終止密碼子除完整的三聯體密碼子 TAA 和 TAG 之外,還包括不完整的終止密碼子如 TA 和 T。這種不完整的終止密碼子在后生動物的線粒體基因組中很常見,研究者推測其可在轉錄后通過多聚腺苷酸作用形成完整的終止密碼子進而完成轉錄終止 [29]。
線粒體基因組外無組蛋白保護,容易受到代謝中間產物的誘變,相對于核基因組具有較高的進化速率 [30]。對直翅目 2 個亞目線粒體基因組的蛋白質編碼基因進化速率 ( 用非同義替代率與同義替代率的比率 Ka/Ks 來表示進化速率 ) 進行對比,分析結果如圖 5 所示 :不同的蛋白質編碼基因的進化速率不同,其中 atp8 基因進化速率最快,而 cox1 最為保守,13 種蛋白質編碼基因在直翅目中的進化速率順序為 atp8 > nd6 > nd4 > nd5 > nd4L > nd1 > nd2 > atp6 > nd3 > cox2 > cox3 > cytB > cox1 ;相同的蛋白質編碼基因在不同的類群中同樣存在顯著的差異,除 atp8 基因,其余 12 個蛋白質編碼基因在蝗亞目中的進化速率均快于螽亞目 ;13 個蛋白質編碼基因的 Ka/Ks 均小于 1,表現出純化 ( 負 ) 選擇,即基因發生非同義突變后作為劣勢被淘汰了。
2.5 tRNA和rRNA特點
已測的直翅目昆蟲線粒體基因組中,大多 trnSAGN 缺少 DHU 臂,缺失 DHU 臂后的 trnSAGN 仍可形成倒 L 型三級結構來維持 CCA 接受臂與反密碼子間的距離 [31] ;其余 21 個 tRNA 均能折疊形成典型的三葉草結構,當然也有例外,霍山蹦蝗 (Sinopodisma houshana) 的 trnP 只有 58 bp,可變環和 TΨC 臂均不完整 [32]。tRNA 在形成三葉草結構堿基配對時會發生一些錯配,主要是 G-U 錯配。這種現象在昆蟲中均普遍存在,在對蜘蛛 (Araneida) 線粒體 tRNA 的研究中發現,發生錯配的堿基可以通過轉錄后編輯恢復正常配對,從而推測線粒體 tRNA 基因缺失 DHU 臂或 T 臂對其正常功能的行使影響不大 [33]。此外,直翅目昆蟲 tRNA 攜帶的反密碼子非常固定,尚未發現其他特殊的反密碼子。
相關知識推薦:線粒體實驗論文發表
rRNA 基因包括 rrnL 基因 (lrRNA 或 16S rRNA)和 rrnS 基因 (srRNA 或 12S rRNA),其大小和位置相對保守,且堿基組成表現出明顯的 AT 偏好。 rrnL 基因的二級結構包括 6 個結構域 (I、II、III、 IV、V 和 VI),其中結構域 III 在節肢動物線粒體基因組中是缺失的,結構域 IV 和 V 保守程度較高 ; rrnS 基因的二級結構包括四個結構域 (I、II、III 和 IV),通常結構域 I 和 II 變異較大,而 III 和 IV 比較保守 [34]。直翅目昆蟲線粒體基因組中 rrnL 基因位于 trnLCUN 和 trnV 之間,平均長度為 1 317 bp,其中最長的為短星翅蝗 (Calliptamus abbreviatus),長度為 1 555 bp ;最短的為歐洲巨螻蛄 (Gryllotalpa pluvialis),長度為 1 236 bp[19]。直翅目昆蟲線粒體基因組 rrnS 基因的長度遠小于 rrnL 基因,平均長度僅為 800 bp,其中最長的為蛉蟋科的 Trigonidium sjostedti,長度為 1 004 bp[35],而最短的為暗色佛蝗 (Phlaeoba tenebrosa),長度僅為 212 bp。
2.6 控制區特點
直翅目昆蟲控制區位置相對保守,通常位于 rrnS 和 trnI 之間,但也有例外,例如傅氏綠露螽、長裂華綠露螽和四川華綠露螽的控制區位于 nd2 和 trnQ 之間,翅糙頸露螽的控制區位于 trnY 和 cox1 之間 ;長度差異很大,其中最短的為疑鉤頂螽 [14],僅有 70 bp,而最長的為長裂華綠露螽 [16],控制區長度為 3 122 bp。不同物種間控制區的長度變化主要與高度重復的序列的數量和大小相關,這些重復序列可進一步形成簡單的發夾結構或更為復雜的二級結構,阻礙復制的進程。有研究表明,盡管不同物種線粒體 N 鏈的復制起點位置不同,在一些全變態昆蟲的線粒體中存在的 T-strech (ploy-T > 10 bp) 可能與復制起始識別有關,而部分半變態昆蟲的線粒體基因組并不含 T-strech 結構 [36]。在直翅目中,大部分蝗亞目以及螽亞目的蟋蟀總科和螻蛄總科昆蟲的線粒體控制區中雖然沒有 T-strech 結構,但研究者在其對應位置發現 ploy-T 的結構被堿基 C 打斷,并形成了相應的莖環結構,例如非洲飛蝗(Locusta migratoria) [12]、秦嶺蹦蝗 (Sinopodisma tsinlingensis) [37]、僧帽佛蝗 (Phlaeoba infumata) [37]、小凸額蝗 (Traulia minuta) [37] 等 ;在螽亞目的螽斯總科幾乎很難預測到這樣的莖環結構 [34],但研究者在螽斯總科部分物種的線粒體控制區 N 鏈上發現了 T-strech 結構,例如摩門螽斯 (Anabrus simplex) [38]、笨棘頸螽 (Deracantha onos) [39]、優雅蟈螽 (Gampsocleis gratiosa) [38] 和黑角綠露螽 (Phaneroptera nigroantennata) [37]。總而言之,昆蟲線粒體控制區的序列長度和結構變異很大。——論文作者:趙 樂1,2,李雪娟1 ,黃 原1 *
SCISSCIAHCI