论文部分内容阅读
寻找物种基因组中k-mer频数分布的特征,对几个典型物种的基因组序列进行了统计分析.区分“字”域和“频数”域。运用两种求信息熵的方法——Shannon信息熵和Fisher信息熵,定义了五种k-mer频数的泛函.发现对于每一物种,由Shannon信息熵定义的四种泛函与k之间都具有很好的线性关系,并且这种线性关系在所研究的物种问具有普适性.