论文部分内容阅读
胡椒(Piper nigrum),为多年生藤本植物,素有“香料之王”的美誉,是世界上最重要的香辛料作物之一,具有广泛的药用和工业利用价值。胡椒属因其显著的多样性和处于基部被子植物中长期独立的进化历程,在物种进化研究中有重要意义。胡椒所属的胡椒目位于木兰亚纲(magnoliids)内,是被子植物中较为原始的类群,且兼具有类似的单子叶和双子叶植物双重形态学特征,使得整个木兰亚纲相较于单子叶和双子叶植物的进化位置存在争议。胡椒碱作为胡椒最主要的功能物质,除在烹饪中广泛使用外,其在化学预防、免疫调节、抗氧化、抗癌、消炎、解毒作用和促进中草药和传统药物的吸收以及生物药效率等方面具有广泛的作用。目前,关于胡椒的基础研究较为薄弱,高质量参考基因组的缺失、胡椒碱等关键功能物质代谢复杂等因素,严重阻碍了胡椒的分子育种及其资源的深度开发与利用,制约了胡椒碱的应用潜力。因此,本研究对胡椒进行全基因组测序和染色体水平的高质量组装,综合解读胡椒的基因组特征,物种进化位置,并进一步对胡椒碱合成代谢网络和关键基因及其基因家族进行深入研究,初步解析胡椒碱生物合成分子机理,为后续的遗传改良奠定分子基础。取得的主要研究结果如下:1.构建染色体水平的高质量胡椒基因组。作为整个基部被子植物类群胡椒目中第一个完成全基因组测序的物种,胡椒基因组的大小为761.74 Mb,杂合度为1.33%,重复序列比例为59.54%,属高杂合且高重复序列的复杂基因组。因此,本研究结合PacBio第三代测序、10x Genomics、基于直接标记和染色(DLS)的BioNano单分子光学图谱和Hi-C染色体交互捕获四种测序技术对胡椒基因组进行de novo组装和染色体锚定,并用二代Illumina数据对组装结果进行潜在InDel和小片段错误组装的纠正。经过PacBio和10x Genomics数据初步组装的胡椒基因组(“Piper_nigrum_v1”)包含有1,277条scaffolds,其N50值为2.3 Mb,组装基因组大小为791.0 Mb。进一步的BioNano和Hi-C辅助组装后,得到组装基因组大小为761.2 Mb,其中包含45条scaffolds序列,且N50达到29.8 Mb的最终染色体级胡椒基因组组装结果“Piper_nigrum_v3”。Illuminareads、RNA-seq、CEGMA和BUSCO综合对胡椒基因组组装结果进行评估,显示了较高的完整性和准确性。2.完成胡椒基因结构和功能注释。本研究首先通过从头预测和同源序列比对相结合的方法对胡椒基因组的重复序列进行注释和屏蔽,结果显示重复序列占总基因组的54.85%,其中54.01%属于散在重复序列,进一步细分有40.55%属于长末端重复序列反转录转座子(LTR-retrotransposons,LTR-RTs),LTR-RTs 中主要类型 LTR/Gypsy 占 27.63%和LTR/Copia占9.95%;随后选用BRAKER2基因结构注释流程,结合从头预测、胡椒属UniProt蛋白数据库数据和RNA-seq和Iso-seq测序转录组数据,对胡椒基因组基因结构进行预测。结果共注释到63,466个蛋白编码基因;另外,还注释到1,514个转运 RNA(tRNA),1,206 个核糖体 RNA(rRNA),1,533 个小核 RNA(snRNA),256 个非编码 RNA(miRNAs),6,509 个长链非编码 RNA(lncRNAs),59 个转录因子(transcription factors,TFs)家族,157 个转录调节因子(transcriptional regulators,TRs)和 646 个染色质调节因子(chromatin regulators,CRs)。在基因功能注释中,有48,277和46,256个基因分别比对到NR和UniProt数据库,进一步InterProScan分析共鉴定到3,652个蛋白家族和2,071个GO分类。KEGG注释显示共有11,362个蛋白编码基因注释到KO功能,57,700个基因注释到330个代谢通路中。次生代谢物注释共鉴定到10与生物碱代谢通路相关的基因簇。3.鉴定到发生于胡椒中的全基因组复制事件。对胡椒基因组进行共线性分析,结果显示胡椒基因组内存在1,295个共线性区块,占约基因组注释到总基因数量的45.10%,其中66.0%的旁系同源基因位于不同染色体间,34.0%的位于染色体内。其次,共线性dot图分析显示胡椒染色体内和染色体间存在大量的复制区域。此外,胡椒基因组的相互最佳匹配基因对和共线性区块基因对的同义替换率(Ks)分布显示在大约0.1处存在明显的单峰。明确了发生于胡椒的全基因组复制事件,并计算得出胡椒的全基因组复制(WGD)事件发生时间大致为17.2-17.9百万年前(MYA)。4.确定了胡椒及其所在木兰亚纲的系统发育位置。基于21个典型物种的比较基因组和系统发育分析,确定了胡椒及其所在木兰亚纲的系统发育位置。本研究在胡椒、9个双子叶植物、3个单子叶植物、3个木兰亚纲植物、无油樟、2个裸子植物和两个低等植物外群共21个物种中鉴定出82个单拷贝直系同源基因。随后,利用这82个单拷贝直系同源基因进行物种进化树的构建和分歧时间的评估,结果显示木兰亚纲与整个单子叶-双子叶互为姐妹关系,进一步胡椒目与木兰目-樟目互为姐妹关系,且大约在175-187 MYA(95%HPD)发生分歧。5.初步揭示了胡椒中胡椒碱生物合成分子特征。通过分析胡椒中的基因家族扩增和不同组织的RNA-seq转录组数据,揭示了胡椒碱合成的重要代谢过程:苯丙烷代谢途径和赖氨酸代谢途径,以及酰基转移代谢过程。基因家族扩张分析发现,91个基因家族在胡椒中发生扩张,其中有35个基因家族发生显著扩张(family-wide P-value≤0.01)。胡椒物种特异的基因家族扩张相关基因显著富集在次生代谢相关功能和抗病防御相关基因中。不同组织的RNA-seq转录组数据分析发现参与到苯丙烷代谢途径和赖氨酸代谢途径的基因在果浆中特异高表达,且BAHD-AT和SCPL-AT基因家族的扩张伴随着在果浆组织中的高表达,将苯丙烷代谢和赖氨酸代谢联系起来。进一步对属于苯丙烷代谢途径和赖氨酸代谢途径以及BAHD-AT和SCPL-AT基因的扩张基因家族进行序列水平分析,检测到不同程度的纯化选择和正向选择。