论文部分内容阅读
首先从理论上研究了关联规则发现问题,通过研究发现依赖最小支持度和信任度的理论得到了经典关联规则存在的问题所在,提出通过引入相关计算的方法进行补充,以达到文本数据有效性的判别,并提出一种基于相关计算的算法设计,最后通过模拟实验进行验证.随后研究了数据项的分割与关联规则发现之间的关系,不同的数据分割会产生不同的结果,由于文本数据之间存在语义联系,因此,提出一种基于距离的关联规则的定义方法及其新的度量标准.其次研究了贝叶斯网络的拓扑结构问题.贝叶斯网络是一种描述数据及其依赖关系的表示模型,但是如何获得它的网络拓扑结构是一个未得到解决的问题,通过对获得的文本数据进行数据分析的基础上来创建贝叶斯网络拓扑结构的方法,并提出一种启发式算法进行网络创建.最后的实验结果说明方法的有效性.最后传统聚类算法存在的问题,通过对传统聚类算法的研究找出其存在的不足之处,提出一种新型的聚类算法.