论文部分内容阅读
伴随着分子生物学技术的发展,DNA测序工作得到广泛开展。研究DNA序列结构与生物遗传信息的传递与表达之间的联系,具有重要的现实意义。因此,DNA序列分析成为基因研究的重要基础。必需基因是维持基本生命活动所必需的基因,识别出必需基因序列,对于新药的研制,控制疾病具有重要的应用价值。由于物种DNA数据量庞大,还有许多物种的必需基因尚未测定,而且实际的测序过程也十分繁琐。所以,采用非线性理论对生物基因组中的必需基因和非必需基因进行特征对比分析,对于这两类基因的预测识别是十分必要的。 本文基于混沌游戏表示方法,对比分析了细菌物种必需基因和非必需基因DNA序列的Hurst指数分形特征,以及蛋白质序列信息维数。通过对目前所有已识别出的细菌物种的必需基因和非必需基因的Hurst指数进行统计对比分析,发现其Hurst指数呈Gamma分布,基因序列长度与Hurst指数存在线性关系,两类基因Hurst指数存在显著性差异。对于蛋白质序列信息维数,发现蛋白质序列长度和信息维数之间存在线性关系,并且绝大多数细菌物种必需基因和非必需基因蛋白质序列信息维数之间存在显著性差异。此外,基于混沌游戏表示方法,采用绝对差法,Pearson距离法等对21个生物体细胞色素C进行相似度比较,构建系统发育进化树,结果表明,Pearson距离法绘制的进化树相对于绝对差法更符合自然进化关系。