论文部分内容阅读
将拟南芥基因组全序列,按内含子、外显子及基因间序列区分为三类.在统计分析的基础上,选取21种三联体的概率,作为信号参数,并以这些参数分别构建内含子、外显子和基因间序列的离散源,计算了离散量.某区间上任意一段序列的类型是由其离散量D(X)与同一区间上的三个标准离散量D(Xe)、D(Xi)和D(Xs)之间的离散增量的最小值决定的.由此实现了用离散量对三种核苷酸序列类型的预测,预测结果表明:标准集准确率达到84.26%,检验集达到84.64%.