【摘 要】
:
随着互联网及存储技术的快速发展,出现了大量的结构复杂的数据,如生物学数据、Web数据和XML数据等,这些数据大都可以用树或图的结构来表示。如何从这样的数据中提取出有用的
论文部分内容阅读
随着互联网及存储技术的快速发展,出现了大量的结构复杂的数据,如生物学数据、Web数据和XML数据等,这些数据大都可以用树或图的结构来表示。如何从这样的数据中提取出有用的信息,已经成为数据挖掘领域研究的热点。本文对序列、子树挖掘方法的研究现状进行了分析,对利用序列挖掘方法解决子树挖掘的问题进行了研究。首先,提出基于投影编码的频繁嵌入子树挖掘算法—PETreeMiner,算法利用序列中无候选产生的技术—前缀投影技术来挖掘频繁嵌入子树。在投影过程中利用结点的范围属性对结点进行编码,投影得到带有编码的频繁序列,且该序列能够与一棵频繁子树对应。通过定理证明了算法的正确性,并对算法进行了实验分析。其次,提出了增量挖掘频繁嵌入子树的算法—IncPETM。当数据库稍有改变时,重新对数据库进行挖掘,原先挖掘的结果变得毫无用处,也造成了时间空间的浪费。针对这种情况,可利用已有的挖掘结果,得到因增量数据库新产生的频繁模式,从而避免对更新后数据库的重新计算。通过定理证明了算法的正确性,并对算法进行了实验分析。最后,提出了频繁归纳子树的挖掘算法—PEITM,通过定理证明了算法的正确性。并把PEITM算法与现有基于投影的PFTM算法进行了实例分析比较,虽然两者的效率相似,但是,PEITM算法比PFTM算法拥有更好的扩展性。
其他文献
集成学习通过训练多个学习器把它们的结果进行集成能够显著地提高学习系统的泛化能力,被认为是一种有效的工程化智能计算方法。本文对集成学习方法作了一些较深入的研究,取得了
随着国内人民生活水平的提高以及现代高科技和电子技术的发展,人们对居家的舒适性要求越来越高,原来的家用空调系统已经出现各种弊端,比如操作复杂,准确度低等,家用空调实现自动化
本文的课题来源于台湾致伸公司与中山大学图形图像技术实验室的合作项目:图像处理关键技术研究(项目代号:2006-35240-7101057)第二期的课题.高动态范围图像处理技术。 近年来
工作流技术是近年来发展较为迅速的一项技术,它在实现企业过程重组、面向过程的应用方面显示了广阔的应用前景。工作流建模是实施工作流应用的第一步,近年来学者们对于建模理论
P2P网络是近年来计算机领域研究与关注的一个焦点,它在很多领域都得到了应用。然而,由于P2P网络具有分散化、自治性、动态性、自组织性、异构性等特点,使得P2P通信系统需要在
随着航天航空领域的快速发展,传统的数据存储与分析方法已经不能满足于目前的庞大数据量,而云计算技术的出现和发展,很好的解决了这一问题。本文主要研究使用云计算技术中的并行
机器视觉研究试图实现从2D图像到3D场景的推断。一个完整的机器视觉系统往往要涉及一系列复杂的过程,从图像获取、预处理、特征提取/选择,到更高级的推断决策。这些过程之间高
近年来,越来越多的高校网站如雨后春笋般地建设起来。然而,在信息网站给人们生活带来便捷的同时,与之相关的诸多安全与管理方面的问题往往都被这些网站的建设者们忽略了。随着高
随着internez的快速发展,电子商务作为一种新的商务模式吸引了越来越多的注意力,对电子商务而言,电子支付系统是至关重要的。电子现金又是一种非常重要的电子支付系统。论文重点
P2P是英文peer-to-peer的缩写,即对等网络或对等计算。它是一种网络模型,在这种网络中每个节点的地位都是相同的,无服务器与客户机之分。随着Napster等P2P系统的出现,人们开始关