學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

基因組選擇在林木遺傳育種研究中的進展與展望

發布時間:2021-04-08所屬分類:農業論文瀏覽:1

摘 要: 摘要:基因組選擇技術是目前動植物遺傳育種的關鍵技術和研究熱點,已在一些動植物的遺傳改良工作中取得了重要進展。林木具有世代間隔長的生物學特性,因而育種周期長,早期選擇是縮短林木育種周期和加快林木育種進程的有效方法。林木早期選擇研究可以粗略分為

  摘要:基因組選擇技術是目前動植物遺傳育種的關鍵技術和研究熱點,已在一些動植物的遺傳改良工作中取得了重要進展。林木具有世代間隔長的生物學特性,因而育種周期長,早期選擇是縮短林木育種周期和加快林木育種進程的有效方法。林木早期選擇研究可以粗略分為3個階段:基于性狀表型早晚期相關的早期選擇、分子標記輔助選擇的早期選擇以及基因組選擇。林木遺傳改良的目標性狀主要是生長性狀和木材品質性狀,其大都是復雜的數量性狀,在生長進程中受到更加持久的環境影響。同時生長性狀的遺傳力是隨著生長進程而發生變化的;蚪M選擇在林木遺傳改良中的應用受限于多年生林木自身特點以及研究基礎薄弱,包括世代間隔長、體型高大、幼齡期長、基因組和表型組等組學數據匱乏以及相關研究技術平臺不完善等因素。為了推動基因組選擇技術在林木遺傳改良中的應用進程,本文介紹基因組選擇技術的原理與方法,總結基因組選擇技術在林木遺傳育種中的研究進展,探討基因組選擇技術在林木遺傳改良中應用的限制性因素。簡要介紹基因組選擇的線性模型、統計學估計方法(SNP-BLUP、GBLUP和Bayesian估計模型)和分析工具(rrBLUP、synbreed、BGLR、GVCBLUP、GAPIT、sommer和BLUPGA,等)。概括總結基因組選擇技術在林木育種中應用的優勢,簡要概述闊葉樹種(楊屬、桉屬、油棕屬和橡膠樹屬)和針葉樹種(松屬和云杉屬)的基因組選擇研究案例,以油棕基因組選擇研究作為典型案例分析。林木樹種的基因組選擇研究案例均表明基因組選擇技術有助于提高林木選育效率和加快林木育種進程。深入探討林木樹種的參考基因組、全基因組關聯分析、育種群體、連鎖不平衡和多年生屬性5個方面對林木基因組選擇研究的影響;蚪M選擇在林木遺傳育種研究中具有潛在應用前景,但其可行性仍需要大量的模擬數據和真實數據評估。當前林木基因組選擇研究所面臨的重要問題:1)林木樹種的基因組組裝質量普遍不高;2)如何開展林木多性狀全基因組選擇研究;3)針對多年生林木樹種自身特點,設計出合理的試驗方案,開發具備縱向性狀數據處理能力的統計模型和分析軟件。

基因組選擇在林木遺傳育種研究中的進展與展望

  關鍵詞:基因組選擇;選育效率;林木遺傳改良;全基因組關聯分析

  基因組選擇(genomicselectionorgenome-wideselection,GS)研究在家畜和農作物遺傳改良中已取得了重要進展,其中應用于奶牛的遺傳改良成效顯著。美國農業部從2009年開始對奶牛開展GS研究,配種公牛和配種母牛的育種周期都減少到2.5年,大大加速了育種進程(Garcia-Ruizetal.,2016)。中國農業大學聯合全國畜牧總站等單位完成的中國荷斯坦牛GS分子育種技術體系的建立與應用的研究成果,使我國荷斯坦奶牛(Bosprimigeniusf.taurus‘Holsteincattle’)年產奶量從4500kg提高到5500kg,顯示GS在我國奶牛遺傳改良中取得了重大進展(http:∥www.most.gov.cn/kjbz/201703/t2017-132048.htm)。相較于家畜GS,農作物研究起步較晚,但近年來發展迅速,在水稻(Oryzasativa)(Onogietal.,2016;Xuetal.,2018)、玉米(Zeamays)(Fritsche-Netoetal.,2018;Milletetal.,2019)、小麥(Triticumaestivum)(Huangetal.,2016;Bassietal.,2016)、大麥(Hordeumvulgare)(Schmidtetal.,2016;Thorwarthetal.,2017)、蘋果(Malus×domestica)(Kumaretal.,2012;Murantyetal.,2015)和梨(Pyruspyrifolia)(Iwataetal.,2013;Minamikawaetal.,2018)等農作物和果樹的遺傳改良研究中獲得一定進展。

  林木生長周期長,早期選擇是縮短林木育種周期、加快林木育種進程的有效策略和方式(Diaoetal.,2016),長期以來一直是林木遺傳改良研究中持續關注的熱點。最早基于性狀表型值早晚期相關(phenotypiccorrelationbetweenjuvenileandmatureperiod)的早期選擇研究,其選擇精度往往受限于試驗樣本量不足;诜肿訕擞涊o助選擇(markerassistedselection,MAS)的早期選擇研究,由于篩選出的分子標記數量有限,早期選擇效率不高。GS利用全基因范圍內的所有分子標記估計目標個體育種值,并以此為依據篩選優良基因型(superiorgenotype)。相比于前2種早期選擇技術,基因組選擇具有更高的育種效率和更準確的選擇精度。隨著二代/三代測序技術與高通量SNP基因分型技術的快速發展,GS技術應用于林木重要性狀早期選擇已成為可能。

  相比于家畜與農作物,林木樹種的GS研究進展相對緩慢,主要是由于多年生林木樹種的遺傳學研究基礎薄弱、研究技術平臺不完善、基礎型數據匱乏(例如,基因組數據、轉錄組數據、表觀組數據和表型組數據)和獨特生物學特性(世代間隔長、體型巨大和幼齡期長)。為了加快GS技術在林木樹種遺傳育種中的應用進程,本文對GS原理與方法進行全面介紹,并通過林木基因組選擇案例的闡述和分析,對GS技術在林木遺傳改良中應用的影響因素及發展前景進行討論。

  1基因組選擇原理與方法

  Meuwissen等(2001)首次提出了基因組選擇(GS)的概念和原理。GS是一種新型遺傳評估手段,對縮短育種世代間隔、加快遺傳進展和提高選擇效率等均具有積極作用(Meuwissenetal.,2001);蚪M選擇技術已成為動植物育種領域中最具潛力的技術熱點,期刊《GENETICS》和《G3:Genes|Genomics|Genetics》將GS相關研究論文歸檔(https:∥www.genetics.org/collection/genomic-selection)。

  相關期刊推薦:《林業科學》是中國林學會主辦的林業基礎性和高科技學術期刊,創刊于1955年。主要刊登森林培育、森林生態、林木遺傳育種、森林保護、森林經理、森林與生態環境、生物多樣性保護、野生動植物保護與利用、園林植物與觀賞園藝、經濟林、水土保持與荒漠化治理、林業可持續發展、森林工程、木材科學與技術、林產化學加工工程、林業經濟及林業宏觀決策研究等方面的文章,以學術論文、研究報告、綜合評述為主,還設有學術問題討論、研究簡報、科技動態、新書評介等欄目。以中文文章為主,也刊登附中文摘要的英文文章。

  GS是利用覆蓋全基因組的高密度分子標記估計個體的基因組育種值(genomicestimatedbreedingvalue,GEBV),并以基因組育種值為依據選擇優良基因型/品種。GS一般需要構建參考群體(referencepopulation/trainingpopulation)和候選群體(candidatepopulation/testingpopulation)2個群體;利用參考群體中已知的表型(phenotype)和基因型(genotype)記錄估計出GS線性模型中每個分子標記SNPs(singlenucleotidepolymorphisms)的效應值;然后,通過候選群體中個體的已知基因型數據和SNPs效應估計值估算GEBV;最后,根據GEBV排序從候選群體中選擇出保留個體。

  1.3GS分析工具

  伴隨著GS統計學估計模型的提出,很多應用這些GS模型的分析工具也被同步開發出來,例如rrBLUP(Endelman,2011)、synbreed(Wimmeretal.,2012)、BGLR(Perezetal.,2014)、GVCBLUP(Wangetal.,2014)、GAPIT(Lipkaetal.,2012)、sommer(Covarrubias-Pazaran,2016)和BLUPGA(Kaineretal.,2018)等,具體見表1。目前GS分析工具的主要特點:1)缺乏針對林木特點(多年生、異交和全同胞家系成員龐大)的分析工具;2)主要基于GBLUP和Bayesian2類統計學估計模型;3)C++、Fortran、Julia和R是開發GS分析軟件所使用的計算機語言,而R語言是最常用的GS軟件開發語言。由于R語言運行速度較慢,因此基于R語言的GS分析工具分析速度比較慢,該缺點在分析海量分子標記(例如100k級以上)時進一步地放大。因此,具備快速處理海量分子標記數據的能力必將是GS分析軟件開發的重要方向之一。

  2林木基因組選擇研究進展

  2.1GS技術在林木育種中應用的優勢

  相比家畜和農作物,林木GS研究起步不晚,但進展緩慢。Wong和Bernardo(2008)利用油棕(Elaeisguineensis)模擬數據系統地評估表型選擇、分子標記輔助選擇(MAS)和基因組選擇(GS)3種選擇方式后發現:GS的效果要明顯好于表型選擇和MAS,GS技術在世代間隔長和樣本量小的育種群體中仍可獲得一定的遺傳增益。2012—2019年間,GS研究陸續在油棕屬(Elaeis)、桉屬(Eucalyptus)、橡膠樹屬(Hevea)、云杉屬(Picea)、松屬(Pinus)、楊屬(Populus)等樹種開展,取得重要進展(表2)。以上研究結果都表明:GS技術可以應用于林木遺傳改良,有助于縮短林木育種周期、提高林木育種選擇效率和加快林木遺傳改良進程。GS技術在林木育種中應用的優勢主要表現在:1)預測精度高,比表型選擇和分子標記輔助選擇2種策略具有更高的準確性;2)選擇效率高,可以有效地縮短林木超長的育種周期(十幾年甚至幾十年)、增加單位時間內的遺傳增益以及增強選擇強度,最終實現加快林木育種進程的目標;3)可解釋的遺傳變異比例更高,這是由于GS使用全基因組范圍內的高密度SNPs標記,遺傳變異位點信息量巨大;4)子代測定成本相對較低(Grattapagliaetal.,2011;Isik,2014;Iwataetal.,2016;Nyoumaetal.,2019)。

  2.2林木GS研究概述

  目前,林木基因組選擇(GS)研究都是以多年生異花授粉樹種為研究對象,這些樹種的生長周期較長且遺傳雜合度高。針葉樹種和闊葉樹種在開展GS研究的樹種中幾乎各占一半。開展GS研究的針葉樹種主要集中在云杉屬[例如,歐洲云杉(Piceaabies)、白云杉(P.glauca)、黑云杉(P.mariana)、西加云杉(P.sitchensis)]和松屬[例如,火炬松(Pinustaeda)和海岸松(P.pinaster)](表2)。針葉樹種一般擁有一個雜合度和重復序列比例極高的10Gb級基因組,這為開展針葉樹種GS研究帶來了極大的挑戰,特別是在覆蓋全基因組的高密度標記(SNPs)開發方面(Nystedtetal.,2013;Biroletal.,2013;Nealeetal.,2014;Ziminetal.,2014;2017)。

  與針葉樹種類似,已開展基因組選擇研究的油棕屬[油棕(Elaeisguineensis)、美洲油棕(E.oleifera)](Singhetal.,2013)、橡膠樹屬[橡膠樹(Heveabrasiliensis)](Rahmanetal.,2013;Lauetal.,2016;Tangetal.,2016)、桉屬[赤桉(Eucalyptuscamaldulensis)、巨桉(E.grandis)](Hirakawaetal.,2011;Myburgetal.,2014)以及楊屬[毛果楊(Populustrichocarpa)、胡楊(P.euphratica)](Tuskanetal.,2006;Maetal.,2013)均有一個以上的物種完成了全基因組測序。由于楊樹作為林木模式物種的重要性,毛果楊是第1個完成全基因組測序的樹種,推動了林木基因組研究的廣泛開展。南京林業大學楊樹研究組以美洲黑楊×歐美楊(P.deltoides×P.euramericana)全同胞家系為材料,結合該家系100多個體的生長性狀24年生的表型數據,通過基因組重測序獲得100k級的SNP位點,估計育種值和遺傳力的動態變化,并在此基礎上開展GS研究(朱嵊等,待發表)。

  GS是以育種群體(參考群體)的基因型數據(即標記數據)和目標性狀表型數據作為基礎數據,通過統計學方法構建目標性狀的GS預測模型。為了更好地理解以上所列的林木GS研究案例,從育種群體、標記數據、目標性狀以及統計學方法這4個方面對這些案例進行簡單的概括和分析(圖1)。1)育種群體:多采用由全同胞家系(full-sib)或半同胞家系(half-sib)組成的育種群體,這些研究案例中的林木樹種均屬于異花授粉植物,一次雜交可以獲得數量巨大且性狀分離的F1子代。2)分子標記數據:絕大部分研究案例都采用SNPs分子標記,這是因為SNPs標記在全基因組上分布廣泛且數量巨大(Shastry,2009),此特點與GS技術的“全基因組范圖1林木GS案例的詞云Fig.1Wordcloudofthegenomicselectioncasesinforestrytrees育種群體、標記數據、目標性狀和統計學方法的關鍵詞分別用紫色、紅色、黑色和黃色表示。字體的大小代表其在林木基因組選擇案例中出現的頻率。此詞云圖是由Python軟件包wordcloud(https:∥pypi.org/project/wordcloud/)所繪制的。Thekeywordsforbreedingpopulation,theamountofmarkers,thetargettraitandthestatisticalmethodsaredenotedinpurple,red,blackandyellow,respectively.Thefontsizerepresentsthefrequencyofthosekeywordsinthestudiesonthetreegenomicselection.ThiswordcloudchartisdrawnbythePythonpackagewordcloud(https:∥pypi.org/project/wordcloud/).圍內的高密度標記”理念十分契合;基于SNPs芯片和基于重測序的SNP分型技術是為這些GS研究案例產生SNPs基因型數據的2種方式,針葉樹種(云杉屬和松屬樹種)案例的SNPs基因分型數據來自于SNP芯片,而闊葉樹種(橡膠樹屬、油棕屬和桉屬)案例采用2種方式產生SNPs基因分型數據。3)目標性狀:林木GS研究案例的目標性狀可以簡單地分成生長性狀(樹高、胸徑、材積等)、木材性狀(木材密度、纖維夾角、細胞壁厚度、彈性模量等)、果實性狀(果/枝比、漿/枝比、核/果比等)、代謝性狀(單株榨油率、精油總濃度、1,8-桉葉油素比例等)、發育性狀(分枝數、萌芽率、生根率等)、紙漿性狀(木質素含量、五碳糖和六碳糖含量、紙漿產量等)、抗性性狀(冠癭瘤體積、是否患銹病等)這幾類;樹高、胸徑、木材密度、材積和纖維夾角(MFA,microfibrilangle)是最常用的研究性狀。4)基因組育種值(GEBV)的估計模型:GBLUP、BayesianLASSOregression(BLR)、RR-BLUP和Bayesianridgeregression(BRR)是這些研究案例中常用的統計學估計模型。

  基因組育種值(GEBV)估計精度是評價GS模型優劣的重要指標,也是GS研究的核心問題之一。GEBV估計精度受到多種因素的影響,包括標記類型與密度、標記抽樣方法、數量性狀位點(QTLs,quantitativetraitloci)效應的分布、連鎖不平衡(LD,linkagedisequilibrium)、參考群體與測試群體之間遺傳親緣關系、參考群體樣本量、樣本間的親緣關系、目標性狀的遺傳力與遺傳結構、估計GEBV的統計學方法等(Habieretal.,2007;Grattapaglia,2014)。——論文作者:朱嵊1,2,3黃敏仁1,3

2023最新分區查詢入口

SCISSCIAHCI

7799精品视频