论文部分内容阅读
miRNA是一类长度为19-24bp的内源性小RNA分子,其主要通过与靶基因结合后在转录后水平进行基因表达调控。近年来认为miRNA参与了植物器官发育、代谢调节和抗逆反应等一系列复杂生物学过程。本研究为了识别与番木瓜、猴面花、江南卷柏、巨桉等植物重要遗传品质相关的miRNA,应用高通量测序技术测定了番木瓜根茎叶三种组织的小RNAPRSV侵染后的番木瓜根茎叶三种组织的小RNA序列,识别了番木瓜miRNA序列;同时本研究通过分析1miRBase数据库中的所有植物miRNA序列特点,提出了植物miRNA生物信息学识别新标准;应用番木瓜、巨桉、猴面花和江南卷柏的全基因组序列进行miRNA生物信息学识别;应用EST序列对5种桉属植物、应用EST序列和GSS序列对木豆的miRNA序列进行识别,为今后进一步开展植物遗传品质改良工作奠定理论基础。主要研究结果如下:应用高通量测序技术在番木瓜中共识别78条保守miRNA前体序列和64条保守miRNA成熟序列。从成熟miRNA的5’端分析发现:番木瓜miRNA中存在明显的碱基偏倚现象,C、U频率最高的位置分别为5’端第19碱基、第1碱基,分别为51.6%和56.3%;番木瓜miRNA上游10bp侧翼序列中嘌呤为优势碱基,同时发现上游侧翼序列中胞嘧啶出现比例明显偏低。而对miRNA下游10bp侧翼序列碱基分析发现嘧啶为优势碱基。番木瓜miRNA*序列的5’端分析发现A在第19碱基中出现频率高达55.1%;从miRNA*序列的3’端分析发现第3碱基中A出现频率高达56.4%。在64条番木瓜成熟]miRNA中共发现38个miRNA为高信度miRNA。只在番木瓜叶中表达的miRNA有4个:cpa-miR169c、cpa-miR169d、 cpa-miR408和cpa-miR482而cpa-miR164g和cpa-miR171h只在根中表达,但其表达量相对较低。没有发现只在番木瓜茎中特异表达的miRNA。病毒侵染后,新诱导出10个miRNA,分别为cpa-miR164g、cpa-miR167e、cpa-miR169c、cpa-miR169d、 cpa-miR171h、cpa-miR172d、cpa-miR319c、cpa-miR390d、cpa-miR408、cpa-miR482。靶序列中31条编码转录因子,3条编码参与蛋白质翻译的蛋白质,71条编码酶。此外有7条编码疾病抗性相关的基因,其主要受cpa-miR17、cpa-miR172c、 cpa-miR396b和cpa-miR482的调控。在番木瓜中共识别31个特异miRNA基因,发现cpa-miR-novel-7可能通过调控RTFL5基因导致植株出现矮化现象,叶片出现斑点等症状。通过对miRBase数据库中8496个miRNA成熟序列和6992条miRNA前体序列及高信度miRNA序列进行分析,提出在对新植物miRNA进行生物信息学预测时应满足一下标准:成熟miRNA长度应介于19-24nt,应有4种碱基组成,GC含量应介于30-70%。miRNA前体序列单碱基平均最小自由能应小于-0.2kal/mol/nt,GC含量应介于30-70%,最小自由能指数应大于等于0.7。miRNA前体序列应该通过与PFAM数据库中的蛋白质序列进行比对去除蛋白质序列,而不应该单纯依赖MFEI指数来区分蛋白质序列与miRNA前体序列。进一步分析发现当前miRBase数据库中78.9%的植物miRNA成熟序列和91.1%的高信度miRNA的前体序列参数和成熟序列参数符合该标准。而符合常用旧识别标准的miRNA仅为66.9%;高信度miRNA分子仅为76.4%。此外,番木瓜中实验证实的保守miRNA前体序列中,93.6%符合本研究提出的标准,78.2%符合旧常用标准。因而本研究提出的miRNA识别标准明显优于旧标准应用生物信息学方法在番木瓜全基因组中新识别594个miRNA,分别属于99个不同的miRNA家族。在江南卷柏全基因组中新识别258个miRNA,分别属于78个不同的miRNA家族。在猴面花全基因组中新识别594个miRNA,分别属于85个不同的]miRNA家族。在巨桉全基因组中新识别1262个miRNA,分别属于195个不同的miRNA家族。从成熟miRNA的5’端分析,在4种植物中都发现miRNA存在明显的碱基偏倚现象,C、U频率最高的位置分别为5’端第19碱基、第1碱基。而对miRNA侧翼序列进行分析发现番木瓜、猴面花和巨桉等3种双子叶植物的侧翼序列碱基偏倚明显,上游侧翼序列所有位点中胞嘧啶出现频率都明显偏低,而对miRNA下游10bp侧翼序列鸟嘌呤出现频率明显偏低。应用miRtour在线分析工具对5种桉属植物的EST序列和木豆EST序列及GSS序列进行miRNA生物信息学预测。在桉属植物中共预测到26条miRNA前体序列和19条不同的成熟miRNA序列。同时发现桉树]miRNA序列在碱基偏倚现象,5’端第1碱基尿嘧啶出现的频率高达52.6%,而在第19碱基胞嘧啶出现频率为61.1%。靶基因预测发现3个与木质形成相关的miRNA。而在木豆中发现43条不同的miRNA成熟序列,隶属于33个不同的miRNA家族。靶基因预测发现有36条编码序列受miRNA调控,其中17条序列编码酶,2条编码转录因子,7条编码参与细胞信号转导的蛋白,5条编码参与蛋白质降解通路的蛋白。