【摘 要】
:
随着人类基因组计划实施的进一步深入,生物数据积累速度不断加快,这就对生物数据的科学分析方法和实用分析工具提出了更新、更高的要求。面对巨大而复杂的数据,如何对其进行
论文部分内容阅读
随着人类基因组计划实施的进一步深入,生物数据积累速度不断加快,这就对生物数据的科学分析方法和实用分析工具提出了更新、更高的要求。面对巨大而复杂的数据,如何对其进行科学的分析、处理和保存给计算机科学、数学等学科提出严峻的挑战,同时也吸引了大量的数理科学工作者转向生命科学的研究领域,使得生物信息学应运而生。生物信息学的研究内容非常丰富,本文的主要工作是对生物信息学中两个重要的研究对象—蛋白质与RNA中的若干问题进行了相关的研究,主要成果有:1、在第二章,我们将蛋白质序列映射为疏水值序列,采用离散傅立叶变换与连续小波变换的方法来提取蛋白质序列的二级结构特征。尤其是预先利用连续小波变换提取信号高频部分,有效的说明了蛋白质序列的周期性特征。最后给出在线软件使用平台,使得该研究成果得以广泛应用。2、在第三章,对于蛋白质二级结构的比较,我们构建了蛋白质二级结构序列的转移概率矩阵和结构特征向量,运用信息离散度函数方法(FDOD)比较二级结构的相似性。该方法得到了比传统比对算法更为合理的蛋白质结构分类。对于蛋白质二级结构类的预测,我们根据蛋白质二级结构序列基本结构元素的含量和空间分布合理的构建了11个蛋白质结构特征,尤其是设计了三个特征重点改善α/β类蛋白质和α+β类蛋白质的预测精度。3、在第四章,基于蛋白质序列提出两种种系发生树构建方法。第一种方法利用氨基酸的理化性质辅助进化分析。我们采用序列之间的条件LZ复杂度距离构建进化树,最后通过真实数据集证实了在蛋白质的特征序列中可以捕捉到进化信息。第二种方法是在蛋白质特征序列的基础上,构建了特征向量并利用概率向量之间的巴氏距离分析了物种间的进化关系,是对已有进化树构建方法的一种有效补充。4、在第五章,提出了一个基于条件复杂度的方法来比较RNA二级结构(包括假结结构)。综合考虑RNA二级结构的信息,我们将RNA二级结构转化成线性特征序列,然后运用条件LZ复杂度算法来进行RNA二级结构的比较。最后,我们对两类RNA二级结构分别进行了相似性分析和进化分析。
其他文献
品种资源是育种的物质基础。育种学家已经逐渐意识到,育种工作实质上是对品种资源的再加工。只有拥有丰富的品种资源,育种工作才能够拥有充分的选择余地,才能不断地选育出高
改革开放三十多年来,我国经济发展取得了举世瞩目的成就,各行各业得到了空前的发展,然而,当经济发展进入深水区,许多行业的发展出现瓶颈,发展前景很不明朗,这不仅影响消费者
目的通过收集国内市场上常见的进口抗体筛查(抗筛)细胞和国产抗筛细胞,了解其抗原构成,比较检出不规则抗体的能力。方法选取临床抗筛阳性或可疑阳性标本111份,3个月前有过输
近几年随着工商登记注册改革制度的实施,地方商事改革、鼓励政策的出台,税收缴纳所属地政策制度的创新,国家大力推进“大众创业,万众创新”的方针,地方性的扶持政策为商事制
在精准扶贫的背景下,国家对贫困村庄输入大量的资源进行贫困治理,但是由于村治组织羸弱,乡村自治失灵,乡村不能有效承接国家的资源转移。面对这一问题,国家通过动员干部,组成驻村扶贫工作队,嵌入农村进行精准扶贫。本研究立足于田野调查,以恩施市Z村扶贫驻村工作队为例。文章通过对嵌入式扶贫的实践基础归纳,认为通过干部动员为嵌入式扶贫提供了人力支持,领导和协调制度保证了嵌入式扶贫的高效运行,对扶贫工作人员的考核
2008年金融危机发生以来,风险管理受到金融机构的重视。在风险管理中,资产负债管理是其中非常重要的一环。近年来,资产负债管理在欧美金融界愈发重要,在国内金融界亦是如此。
目的:探讨适合本实验室用M7TT或MTS/PMS检测重组人表皮生长因子(rhEGF)的一系列实验参数,包括血清浓度、细胞浓度、细胞培养时间和酶解程度。方法:利用MTF或MTS/PMS结合酶标仪分别在
藜麦是联合国粮农组织认定的唯一可满足人体基本营养需求的单体植物,具有较高的经济效益和研究价值。随着第二、三代高通量测序技术的发展,藜麦的基因组全貌得以揭示,各类基
【目的/意义】有别于众多现有的针对社会群体事件的定性理论研究,文章采用了定性分析和定量研究相结合的方式探讨群体事件在微博网络中的传播特点,并给出了社会群体事件在微
在城市化背景下,城市的不均衡发展带来了声、光、电、气污染和交通拥堵等问题,影响着人们的生活。久居都市混凝土森林里的人们,对亲近自然、回归乡野和体验绿色生活的渴望呼