發布時間:2020-01-22所屬分類:醫學職稱論文瀏覽:1次
摘 要: 摘要:青錢柳是一種民間常用中藥,青錢柳葉中有多種生物活性的次生代謝物,如有機酸、黃酮類、皂苷類、銥類、精油、無機元素等,但對于青錢柳次生代謝產物合成的分子機制仍未見有報道.使用Illumina公司Hiseq4000平臺對青錢柳葉進行轉錄組測序,對reads進行拼
摘要:青錢柳是一種民間常用中藥,青錢柳葉中有多種生物活性的次生代謝物,如有機酸、黃酮類、皂苷類、銥類、精油、無機元素等,但對于青錢柳次生代謝產物合成的分子機制仍未見有報道.使用Illumina公司Hiseq4000平臺對青錢柳葉進行轉錄組測序,對reads進行拼接,得到50126個unigenes平均長度為1247bp,有19875(39.65%)unigenes由NCBI非冗余數據庫進行注釋的,23716(47.31%)unigenes被注釋到GO數據庫,14950個(29.82%)unigenes匹配到COG功能組.進一步的分析結果顯示,6012(11.20%)個unigenes被富集到254個KEGG代謝通路,其中1212個unigenes參與了次生代謝產物的生物合成,并且發現126個unigenes參與異戊二烯代謝,包括萜烯類、香茅醛、呋喃酮、苷的代謝途徑.此外,總共檢測到21089個簡單序列重復(SSRs).通過對老葉與嫩葉的轉錄組比較分析結果顯示,在青錢柳不同生長發育時期的葉片中,基因表達上調占主異作用的過程主要涉及萜類和多肽的代謝、輔酶和維生素的代謝和氨基酸代謝,而基因表達下調占主異作用的過程主要涉及信號傳輸、類脂物代謝與能量代謝.該轉錄組數據可為青錢柳重要生物活性成分的生物合成和調控提供參考.
關鍵詞:青錢柳;轉錄組;功能注釋
青錢柳(Cyclocaryapaliurus)是我國特有的青錢柳屬(Cyclocarya)植物,是一種主要生長在中國南部山區的著名中藥.青錢柳葉常被用于治療高血糖和高血脂[1-3],青錢柳葉具有抗抗氧化、調節血糖以及修復和保護胰島等多種藥理活性[4].大量的研究表膽,在青錢柳葉存在有一系列的有重要藥理活性的次生代謝物,包括黃酮類化合物、總三萜和青錢柳甙Ⅰ、青錢柳酸B和阿江欖仁酸[5-6].近年來有各種各樣的青錢柳茶被研發,青錢柳葉有效成分的開發利用成為了一個熱點話題,而青錢柳是高大落葉喬木,青錢柳葉采摘難度大,青錢柳資源日逐匱乏.因此,對影響青錢柳葉次生代謝產物的活性成分的因素進行調控以提高活性成分含量,通過基因工程和細胞工程技術獲得更多的青錢柳活性成分,這是當前緩解青錢柳資源短缺和需求逐年增加的矛盾的主要途徑.然而,有關青錢柳次生代謝產物合成機理相關的研究極少,至今有少量有關運用ISSR和SSR標記對青錢柳種質資源進行遺傳多樣性分析的報道[7-8],由于基因組信息太少,很難在分子水平上對青錢柳次生代謝機制和調控進行更多的研究.
近年來,RNA-seq技術可用于預測基因或亞型的表達、檢測差異表達的基因[9],現已被廣泛應用于全基因組轉錄水平的量化,以及分子標記的挖掘和藥用植物中各種次生代謝物生物合成相關基因的鑒定,如蘭花、板藍根、山茶等[10-12].對于至今仍沒有基因組序列的物種,RNA-seq(高通量RNA測序技術)為人們進行次生代謝相關研究提供了一種可行的方法.
在本研究中,利用IlluminaHiseq4000平臺獲得了青錢柳葉的高質量轉錄組數據,共生成50,126個裝配的unigenes,并對公共蛋白數據庫進行注釋,然后進行GO、COG、KEGG分類,檢測到21089例假定的簡單序列重復(SSRs).這些轉錄組數據提供了一個有價值的公共基因組資源,對于理解青錢柳葉次生代謝機制,促進發現與次級代謝途徑及其調控有關的基因,以及未來青錢柳的基因表達譜和功能基因組研究都著十分重要的作用.
1材料和方法
1.1植物材料和RNA提取
2017年6月,在湖南通道縣木腳青錢柳生產合作社基地采集7年生青錢柳老葉(枝條頂端倒數的第6~8片綠葉)與嫩葉(新冒芽的兩葉一心),每個樣品來自3個不同的單株.收集到的樣本立即在液態氮冷凍、儲存在-80℃.使用mirVana試劑盒(Ambion公司)提取總RNA.使用Agilent2100生物分析儀(AgilentTechnologies,SantaClara,CA,USA)評估RNA完整性,RNA完整性較好的樣品(RIN≥7)用于進行后續分析.
1.2cDNA文庫建設和Illumina測序
采用TruSeqStrandedmRNALTSamplePrepKit(Illumina)試劑盒準備轉錄組庫.利用Oligo(dT)磁珠從總RNA中分離出poly(A)mR-NA,進一步純化后,在加入緩沖液,將mRNA隨機分為100~400b的短片段,以這些短片段作為模板,利用逆轉錄酶和隨機引物合成第一鏈cDNA.隨后,采用QubitadsDNAAssay(LifeTechnolo-gies)試劑盒,利用隨機的六聚物引物(Illumina)合成了第二鏈.采用AgencourtAMPureXPkit(BECKMANCOULTER)的試劑盒對cDNA片段進行純化和轉換,進行末端修補,添加A尾混合物,充分混合,加連接混合液,30℃溫浴10min,加反應停止緩沖液停止反應,增加PCR反應按如下程序進行:98℃30s;98℃10s,15個循環;60℃30s;72℃30s;72℃5min;10℃保存.加入AM-PureXP珠進行純化.1μL示例加載在安捷倫2100生物分析儀檢查庫的大小和純潔.使用Illu-minaHiseq4000平臺從5’端到3’端對雙末端RNA-seq測序庫進行測序.
1.3數據篩選和重新組裝
采用IlluminaHiSeqTM2500測得的數據稱為原始讀取,隨后進行原始讀取的質量控制,以確定測序數據是否適合后續分析.在質量控制后,通過篩選得到理想的讀取,然后將25萬對讀取與NR在線數據庫進行污染檢測,以確定樣品是否被污染.隨后對合格的樣品進行基因表達與基因注釋分析,包括借助NR庫、SWISSPROT庫、KOG(真核)/COG(原核)等進行GO分析、KEGG代謝通路分析、基因表達結果篩選.以不同表達的基因為基礎,對樣品間差異表達的基因進行了GO功能顯著富集分析與通路顯著性富集分析.采用NGSQC4Toolkit[13]軟件進行質量控制,去掉接頭,過濾出低質量的堿基,最終得到高質量的干凈讀取.使用Trinityrnaseq_r20131110)[14]軟件通過配對剪接法獲得轉錄序列,然后使用TGICL[15]軟件進行聚類、剔除冗余和擴展,得到最后一組unigenes,這是后續分析的參考序列,采用BLAST算法進行遺傳相似性比對主要[16].
相關知識推薦:發表植物轉錄組測序類文章的SCI期刊
SCI是國際期刊,對投稿論文要求極高,再加上語言差異,一般在SCI上發表論文的作者很少,所以研究植物的作者,對SCI期刊了解得不是很多。下面小編就給大家推薦幾本有關植物轉錄組測序類SCI期刊。
轉錄組數可以進行蛋白質功能注釋,SWIS-SPROT注釋,KOG功能注釋,GO分類,KEGG代謝通路分析.unigenes序列采用blastx方法與NR、SWISSPROT、KOG庫進行比對,得到與給定的unigenes序列相似性最高的蛋白(域值E<1e-5).unigenes的KEGG標注信息是使用KAAS(http://www.genome.jp/kaas-bin/kaas_main)獲取的,基于SWISSPROT標注結果與GO信息,最終得到蛋白功能標注信息.
1.4unigenes的表達豐度計算和差異分析
在轉錄組測序分析中,通過對unigenes的計數來估計基因表達水平.unigenes計數與基因的真實表達水平呈正相關,但也與基因的長度和測序深度呈正相關.通過拼接得到unigenes文庫,通過序列相似性比較的方法得到每個樣本中每個unigene的表達豐度.借助在線軟件bowtie2[17](http://bowtie-bio.sourceforge.net/bowtie2/manual.sht-ml)和eXpress[18](http://www.rna-seqblog.com/express-a-tool-for-quantification-of-rna-seq-data)進行差異比較.采用FPKM方法[19]計算uni-genes的表達數.根據DESeq[20]軟件(http://bio-conductor.org/packages/releasebiochtml/DESeq.ht)計算基因的差異表達量.采用二項負分布檢驗(NB)檢驗讀取次數的差異顯著性.
1.5SSR標記檢測
SSR是指基因組中的簡單序列重復,SSR是在DNA在復制或修復的過程中,由于DNA的滑移而發生交換、錯配,或者是在有絲分裂或減數分裂的過程中由于姐妹染色單體異質性交換的過程中而產生的簡單序列重復.SSR標記在不同物種、同一物種不同位點,甚至是同一位點的不同等位基因之間都有可能存在比較大的差異.然而,即使SSR分布于同一基因組的不同位置,但SSR兩端的序列確是相對保守的單拷貝序列,可以對根據SSR兩端的序列設計特殊引物對SSR進行PCR擴增,再經過電泳檢測可以得到長度條帶,最終可以通過SSR長度的差異比較不同種質的遺傳多樣性.采用MISA和Primmer3.0(ht-tp://pgrc.ipk-gatersleben.de/misa/)軟件SSR標記檢測.
2結果
2.1轉錄組測序產量與組裝質量分析
成功地獲得青錢柳老葉與嫩葉的高質量RNA并分別構建了cDNA文庫,分別采用IlluminaHiseq4000平臺測序,分別得到76412192和78724365個讀取(表1),從合格的讀取中分別篩選到67756231和63465712合格讀取,平均GC含量分別是43.67%和44.18%(表1).采用Trini-ty程序將所有高質量的讀取組裝成50126個uni-genes,覆蓋50%所有核苷酸的最大unigene長度(N50)為247bp,unigenes平均長度為1169bp,構建了N50(1457bp)與平均長度1531bp的60717份轉錄子(表2),unigenes的平均GC含量為43.93%.此外,這些unigenes的長度在301~8456bp之間(圖1),大部分在301~3800bp之間.50126個unigenes中,23563個(47.01%)小于400bp,6017個(12.00%)大于2000bp.這些unigenes可以進行注釋.
2.2葉片轉錄組Unigene的功能注釋
2.2.1葉片轉錄組Unigene的NR功能分類總共有19875(39.65%)unigenes注釋在NRdata-base(表3).與此同時5572(11.11%)、17655(35.22%)、12465(24.87%)、15761(31.44%)、22135(44.16%)與3976(7.93%)個unigenes分別可以注釋在KEGG、Swissprot、KOG、GO、Pfam與String數據庫(表3).進一步的比對表明,注釋的unigenes中92.14%的在NR數據中表現出為高度同源性(E值<1e-30),其中7.12%的E值為0(圖2).此外,將帶注釋的unigenes與其他植物物種已知的核苷酸序列進行了比對,這些序列中12.68%能與葡萄已知的核苷酸序列最為匹配,隨后是胡蘿卜(8.32%),咖啡(5.37%),芝麻(5.20%)(圖2).
2.2.2葉片轉錄組Unigene的GO功能分類利用Blast2GO[21]檢索了青錢柳的GO術語,是將unigenes分門別類放入一個個功能類群.共26098個(52.06%)裝配的unigenes被注釋并分為3大類:生物過程、細胞成分和分子功能,然后分成64子類(圖3).按生物過程分類,其中有細胞過程12139(45.25%),代謝過程22775(45.44%)和單個有機體過程21376(42.64%)是最明顯的(圖3),這表明這些unigenes在青錢柳代謝過程中扮演了一個重要的角色.在細胞成分分類中,unigenes主要與“細胞”21837(43.56%)和“細胞部分”14764(29.45%)有關,其次是“細胞器”8976(17.91%)和“膜”7699(15.36%).細胞外基質、線粒體相關復合體、突觸、突觸部分、病毒和病毒部分只分配了少量的unigenes.在分子功能類別中,大多數被顯著地分為“結合”10876(21.70%)和“催化活性”9674(19.30%).在50126個unigenes中,11463(22.86%)被注釋并劃分為25個功能類別(圖4).其次是“翻譯后修飾、蛋白質轉換、分子伴侶”2876(5.74%)、“信號轉導機制”2354(4.70%)、“翻譯、核糖體結構和生物起源”1874(3.74%)、“碳水化合物運輸和代謝”1572(3.14%),而僅少量的unigenes被歸類為“細胞運動”23(0.05%)以及“細胞外結構”15(0.03%),此外,879(1.75%)個uni-genes被歸類為未知功能.
2.2.3葉片轉錄組Unigene的KEGG功能分類從圖5結果可知8365個(16.69%)的uni-genes主要是用高度相似酶的數目進行注釋,并根據代謝途徑可分為4個分支(圖5),包括代謝、遺傳信息加工、環境信息處理與細胞過程,并進一步分組為254KEGG通路.值得注意的是在圖中顯示24537個unigenes(48.95%)參與了代謝的,其中12182(24.30%)參與了次生代謝產物的生物合成,如碳水化合物代謝3321(6.63%)、氨基酸代謝1697(3.39%)和脂質代謝1472(2.94%).此外,圖6顯示了青錢柳最大的20個帶注釋的通路組.最具代表性的KEGG通路是“碳水化合物代謝”,其次是“信號轉導”、“其他次生代謝產物的生物合成”、“脂質代謝”和“能量代謝”.如圖6所示,有58個(0.13%)的unigenes被歸類到“信號轉導”通路.利用KEGG通路數據庫對上述信息進行歸類,對今后青錢柳的基因功能及其調控機制的研究具有重要意義.
SCISSCIAHCI