论文部分内容阅读
RNA作为一种生物大分子在多种生命活动过程中起着至关重要的作用。RNA的功能与其结构密切相关,结构决定了功能的变化。而RNA二级结构是RNA结构中最核心部分,是RNA一级结构与RNA三级结构间沟通的桥梁,最具保守性。因此,RNA二级结构的研究成为重要的研究方向,其结构比较也日益成为研究的焦点。猪繁殖与呼吸综合征(PRRS)会导致母猪和幼猪的死亡,传播速度快,死亡率高,对养猪业造成巨大危害。目前针对该病没有有效药物进行治疗,仅能采用注射疫苗的方式进行防治,但由于PRRSV具有高度变异性,导致疫苗在免疫效力、安全性等方面仍无法满足实际需求,在实际使用中难以推广,因此研发可靠、高效的新一代疫苗显得尤为迫切。寻找结构稳定的核心免疫RNA序列是设计PRRVS疫苗的关键。采用生物信息学手段对PRRSV的RNA进行分析,确定可能的、关键的、稳定的RNA序列,为疫苗的制备提供理论基础,是本文的研究内容。本文把计算机科学与生物信息学结合在一起,构建了一种基于结构的序列比较分析模型,并将其应用到PRRSV的分析中。模型整体流程如下所述:首先基于特征的RNA数据筛选,构建多特征筛选模型,提高数据有效性,提高处理效率,减少资源利用率。基于已记录的PRRSV的RNA数据,分别将生源地、毒性强弱以及ORF5开放阅读框等做为筛选特征,进行多次特征筛选得到目标数据集。其次采用结构比较方法对目标数据集进行比较。由于一级结构具有较高的重复,因此结构比较分析的结果更多依赖于二级结构比较,因为RNA二级结构相对于一级结构而言更加保守,更能对生物分子的功能起决定性作用。最后根据比较的结果得出了与其对应的结论,设计出相应的新型疫苗。本文的技术创新与主要的工作集中在数据筛选以及RNA二级结构比较这两方面。1、在数据筛选方面。本文选取序列长度在15000nt的初级序列;选取生源地、毒性强弱以及来源和有机体的不同作为第一次筛选的特征;由于ORF5序列在PRRSV分离株间存在高度变异性,是保守性最差的开放阅读框,选取此处数据为后续的数据处理工作提供了极大的便利,省去了许多资源浪费,因此选取ORF5开放阅读框作为第二次筛选的特征。2、建立RNA二级结构比较方法。本文基于树结构与向量的对应关系,抽象出了一种结构中点括号表示法同与其对应的向量表示方法间转换方式;设计了一种基于动态规划思想的改进的树结构的比较算法,利用向量的差异程度来查找其最大的相同子结构。本文对PRRSV分离株的RNA进行比较分析,由分析结果可知虽然一级结构相似度均在50%以上但有较高重复,无法提供理论支持。然而二级结构无重复且相似性均在0.5%以下,相似性仍然较低,但存在相似性相近的地方,表明存在部分相似结构但不是很完整,提取出这些结构可用于疫苗的设计中。