论文部分内容阅读
具有序列特异性基因转录后表达调控功能的microRNA(miRNA)被认为是非编码RNA家族中最为重要的成员之一。MiRNA在众多的关键生物学过程中扮演了重要角色。MiRNA的克隆及功能鉴定是了解基因表达调控规律及其机制的重要内容。数以百计的miRNA从不同的物种中先后被克隆出来,其中部分miRNA的功能已经通过细胞培养实验以及体外实验得到证实。但是,由于实验技术的限制、对miRNA特性了解的不足以及现有预测算法的局限性等问题,现在仍然有大量的miRNA还没有被克隆。而且,除个别miRNA之外,对于那些已经克隆的miRNA,其功能我们还知之甚少。近年来,一些新的方法和技术,如:solexa和454测序技术、miRNA芯片技术、miRNA精确定量技术,被广泛应用于miRNA的研究并取得了诸多成果。本研究从分析已知miRNA的生物学、序列以及结构特点等方面入手,建立了多种miRNA研究的分析方法并开发了对应的软件包。实际应用表明,这些方法和工具不仅具有较高的创新性,还具有很好的实用性。利用建立的工具结合芯片技术我们以猪为研究对象,较系统地考察了多种组织基因及miRNA的表达情况,特别是不同发育时期肌肉组织中基因及miRNA的表达情况,以期寻找与肌肉发育相关的miRNA和基因并研究其相互作用关系。本研究所建立的分析方法以及开发的生物信息学工具,为深入挖掘相关领域的研究数据提供了行之有效的分析策略,这些工具在猪中的应用亦在一定程度上填补了猪miRNA研究的空白,充实了骨骼肌相关组织基因表达数据。主要研究结果如下:一种全基因组miRNA预测方法的建立及其软件实现根据现已克隆的miRNA序列及基因组序列,构建训练数据集和测试数据集,以系统考察miRNA的特征,构建并测试用于miRNA预测的模型。通过对数据集的考察发现miRNA的CG含量、序列长度、二级结构的热稳定性、序列突变率以及序列突变的位置规律等18个特征具有较高的应用价值。根据这些特征结合SVM(支持向量机)方法,本研究成功开发出具有较高性能的miRNA预测软件:miRFinder。该软件分两步进行预测:1)在基因组相对保守的区域中寻找所有可能的能折叠成稳定发卡结构的序列片段;2)利用SVM方法剔除不符合miRNA特征的序列。将该软件应用于人及鸡的基因组miRNA预测,结果发现,miRFinder可以覆盖70%的已知miRNA。将miRFinder与另外两个较为著名的miRNA预测软件miRscan和triplet-SVM相比较发现,miRFinder的误判率明显低于triplet-SVM而检出率明显高于miRscan。一种新的从高通量测序文库中挖掘miRNA的方法及其软件实现高通量测序技术,如:solexa和454,由于其高通量、低成本和读长短等特点,被越来越多地应用于miRNA的研究。除了文库制备过程,Solexa/Illumina和454/Roche测序步骤中的DNA片段微反应器捕获、原位PCR和测序等,由于技术限制,往往很难完美完成。某些随机的DNA片段因此可能会引入到文库中,扩增并最终被检测出来。很明显,这些序列降低了高通量测序文库的可靠性,增加了数据分析的难度,特别是那些低拷贝的序列,数量巨大且淹没在背景噪声之中无法辨识。通过分析miRNA高通量测序文库的数据特点,本研究运用一种新的策略从高通量测序数据中挖掘miRNA,具体步骤为:1)贝叶斯方法去除或降低文库中的背景噪声序列;2)将文库序列maping到基因组上,得到文库序列的基因组序列;3)计算候选序列的二级结构;4)计算候选序列的特征向量的罚分值;5)通过SVM模型判别去除miRNA特征不明显的序列。基于该策略,本研究开发了一个新的高通量测序文库分析的软件包:MiR-Ⅱ。在线虫、小鼠、果蝇等基因组中的测试结果表明MiR-Ⅱ具有优秀的性能。一种基于锁式探针捕获和实时定量PCR技术的miRNA检测方法的建立MiRNA研究需要一种精度较高、操作简便的miRNA定量检测方法。通过对现有的miRNA定量技术的优缺点较为系统的考察和比较,本研究提出了一种新的miRNA定量解决方案。这个方案采用两步法:1)利用一个锁式探针捕获目标miRNA;2)利用实时定量PCR方法检测锁式探针捕获到信号。测试表明该方法的灵敏度可达1-100拷贝/nmol总RNA。重复性可以控制在1%以内。该方法的特异性明显优于其他方法,可以较好的区分序列差异很小的同一家族的不同miRNA。猪miRNA的鉴定及其在不同发育时期骨骼肌中表达谱分析利用所开发的生物信息学工具,以人、小鼠和大鼠等模式动物的miRNA序列以及不同物种的基因组为数据资源,在猪基因组中预测得到784个候选miRNA,去冗余后,得到约500个候选成熟miRNA序列。为验证这些候选miRNA的表达,本实验将提取自33天猪胚胎的miRNA与一张含有576个探针的能够覆盖所有候选miRNA的哺乳动物芯片进行了杂交,结果发现有361个探针具有明显的杂交信号,初步证实了这些候选miRNA的存在。为进一步考察miRNA在猪胚胎期骨骼肌发育过程中的作用,本研究利用该芯片检测了与猪骨骼肌发育密切相关的三个时期的miRNA的表达情况:33天胚胎背最长肌、65天胚胎背最长肌和成年猪背最长肌。数据分析发现,140个miRNA在所考察的时期内表达差异到达显著水平(Foldchange>2,p<0.001,FDR<0.001)。对其中部分miRNA表达水平的Real-time PCR验证结果表明,该芯片结果是可靠的。在这些差异表达miRNA中,与骨骼肌发育相关的miR-206在胚胎期65天和成年期之间上调了2.9倍。另外一些与生长发育相关的miRNA如:miR-214、miR-140、miR-150、miR-10和miR-181等也呈不同程度的差异表达。对这些差异表达miRNA的靶基因预测、功能注释和通路分析结果表明,这些miRNA可能在骨骼肌发育过程中发挥了重要作用。猪不同发育时期骨骼肌mRNA/miRNA比较转录谱分析MiRNA主要通过抑制靶基因的表达来行使其调节功能。MiRNA、蛋白编码基因以及最终行使功能的蛋白质之间是三位一体的关系,在上述miRNA表达谱研究的基础上,本研究进一步应用Affimatrix芯片考察了猪骨骼肌不同发育时期蛋白质编码基因的表达情况,结果发现2,064个基因在所考察发育时期间具有不同程度的表达差异,这些差异表达基因包含一些重要的与肌肉发育、胚胎发育等相关的基因。对miRNA表达谱和Affimatrix芯片所得到的蛋白质编码基因的表达谱进行联合分析发现,有相当数量的miRNA与其靶基因的表达存在显著的关联。例如,在胚胎期高表达的miRNA中,miR-29家族的候选靶基因约有108个,其中有16个基因在所考察的发育时期内表达,其中9个下调表达,一个上调表达。这与miRNA对靶基因的负调控特点高度吻合,也间接表明了实验数据的可靠性。本研究较为系统地揭示了猪骨骼肌不同发育时期miRNA:mRNA表达规律,并为miRNA靶基鉴定提供了有益线索。