论文部分内容阅读
黄连(Coptis chinensis Franch.),为毛茛科黄连属药用植物,其主要药用部位为其干燥根茎,是一种重要的传统中药材。黄连主要含小檗碱、黄连碱、巴马汀、表小檗碱等多种生物碱,其中以小檗碱含量最高。不同产地黄连植物内的功能基因表达水平不同,使其次生代谢产物含量与药材质量产生差异,而黄连又因其产地较多,其药材质量不易控制,致使市场上黄连药材质量参差不齐。本研究选取六个来自不同产地的黄连样本作为研究对象,采用高效液相色谱(HPLC)检测六种生物碱的含量,筛选出总生物碱含量差异较大的三个产地(陕西镇坪、贵州遵义、重庆石柱)的黄连样本用于后续转录组测序分析;采用Illumina HiSeq2500对筛选出的三个产地的黄连样本进行转录组测序,对测序结果进行相应基因以及筛出的选差异基因进行的功能注释和分析,最后挖掘出黄连小檗碱合成途径的相关候选基因,用荧光定量验证候选基因的表达水平与转录组测序结果相一致。主要研究结果如下:(1)HPLC测量黄连生物碱含量,结果显示六个产区黄连样品中均含有六种类型的生物碱,但每种生物碱的含量差异较大,六个产地黄连总生物碱含量排序为:重庆石柱>湖北利川>贵州遵义>四川北川>湖南龙山≥陕西镇坪,其中重庆石柱总生物碱含量最高,表明重庆石柱的黄连药材质量最佳,根据测定结果筛选重庆石柱、贵州遵义和陕西镇坪三地的样本进行转录组测序;(2)选取陕西镇坪(T01)、贵州遵义(T02)和重庆石柱(T03)三地黄连转录组测序,共得到14.89 Gb Clean datas,Q30碱基百分比在90.41%及以上;(3)将T01、T02和T03三组样品测序结果经过软件组装拼接后共得到9441697条contigs,经过进一步组装得到155710条转录本(transcripts)、去除冗余可变剪接转录本后共得到56071条unigenes。Unigenes的N50为858bp,平均长度约为492bp。使用GetORF软件预测unigenes中的CDS,获得了总长达27544206碱基的56028个CDS;(4)对黄连的unigenes进行功能注释,其中COG数据库得到注释14035条、GO数据库24991条、KEGG数据库9462条、Swiss-Prot数据库21742条、NR数据库36935条;共24991个unigenes被注释到128452个GO数据库的条目中,分子功能(MF,Molecular Function)、细胞组成(CC,Cellular Components)和生物进程(BP,Biological Processes)三个GO分类的unigene数分别为38880、30102、59470;共19274个unigenes分类到COG数据库;(5)MISA进行SSR分析,在长度覆盖1kb的14585个unigenes中共识别了6224个SSR,以单碱基重复SSR数目最多;SOAPsnp分析结果显示共识别出了1037576个SNPs,其中970763为双等位基因;(6)分别将T01、T02和T03三个产地转录组测序数据比对(reads mapping)到155710条转录本(transcripts)后,得到比对上的(mapped reads)数目分别为25088487、23905895、24723011条,占各自Clean Reads的81.69%、83.24%、80.29%;(7)不同产地黄连的差异表达基因数目在陕西镇坪与贵州遵义之间(T01vsT02)有6928个、陕西镇坪与重庆石柱(T01vsT03)之间有7068个、贵州遵义与重庆石柱(T02vsT03)之间有7939个。KEGG的注释按照KEGG中通路类型进行分类,其结果显示有11573个unigenes识别了129个KEGG通路,数量最多的通路是“核糖体(Ribosome)”共计948条unigenes,共有32个unigenes参与异喹啉类生物碱的生物合成途径;(8)对筛选出的黄连参与异喹啉生物碱生物合成途径的候选基因:c101794、c168605、c175479、c177134、c150791、c156287、c162923、c129387、c165925和c174243进行验证,荧光定量检测结果与转录组测序结果相一致;综上所述,本研究通过HPLC对不同产地黄连进行含量检测,筛选含量差异大的样本进行转录组测序,获得了大量的黄连基因信息,通过生物信息学方法对差异基因进行相关基因注释和显著性分析,实验结果解析了不同产地黄连质量差异形成的分子机制;同时通过挖掘黄连主要成分小檗碱合成途径的相关候选基因,结合荧光定量PCR技术对黄连的这些候选基因进行验证,实验结果也为黄连小檗碱合成途径的相关基因调控和遗传转化提供数据支持。