论文部分内容阅读
信息离散性度量方法在生物信息处理领域中获得成功的应用,其基本思想是利用子序列分布差异来表示序列之间的差异,但是子序列长度的变化对结果的影响较大。文中提出了一种新的基于信息离散度的DNA序列相似性分析方法,利用不同距离的碱基对的联合概率分布差异来表示DNA序列之间的差异,并分析了信息集变化对结果的影响。实验结果表明,该方法是分析DNA序列相似性的简单且有效的工具。当信息集变化时,相似度较高的序列间的距离值变化很小。