文本数据库的知识发现研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zonghuidiannao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先从理论上研究了关联规则发现问题,通过研究发现依赖最小支持度和信任度的理论得到了经典关联规则存在的问题所在,提出通过引入相关计算的方法进行补充,以达到文本数据有效性的判别,并提出一种基于相关计算的算法设计,最后通过模拟实验进行验证.随后研究了数据项的分割与关联规则发现之间的关系,不同的数据分割会产生不同的结果,由于文本数据之间存在语义联系,因此,提出一种基于距离的关联规则的定义方法及其新的度量标准.其次研究了贝叶斯网络的拓扑结构问题.贝叶斯网络是一种描述数据及其依赖关系的表示模型,但是如何获得它的网络拓扑结构是一个未得到解决的问题,通过对获得的文本数据进行数据分析的基础上来创建贝叶斯网络拓扑结构的方法,并提出一种启发式算法进行网络创建.最后的实验结果说明方法的有效性.最后传统聚类算法存在的问题,通过对传统聚类算法的研究找出其存在的不足之处,提出一种新型的聚类算法.
其他文献
多年来,海难事故频发直困扰着海运业。要在广袤的大海中寻找遇难船只并且真实分析、判断事故的真正原因,必须依靠记录设备来记录船舶的运行记录。在国内外都对船舶VDR的安装做
中国既是世界上最大的煤炭生产国也是煤炭消费大国。煤炭行业在中国的经济建设起着非常重要的作用。而就目前来看,我国采煤方式主要采用地下采矿。这种采矿方式对井下采矿作