关联规则增量挖掘算法研究及应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:uirerhj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从大量数据中获取不同的个性化信息是信息检索领域的研究热点。此方面的研究主要包括元搜索引擎和查询扩展。综合多个搜索引擎返回结果的元搜索引擎其关注点在于为用户提供更多查询结果,查询扩展则通过将用户提交短查询扩展为更多关键词使得查询结果更贴近用户需求。关联规则挖掘是数据挖掘中的一个重要研究方向,也是查询扩展使用的一种重要方法。本文不仅提出了一种改进的关联规则增量挖掘算法,而且结合元搜索引擎和基于此关联规则的查询扩展,提出个性化元搜索引擎的概念。本文首先讨论查询扩展使用的关联规则增量挖掘算法。分析在基于FP-Tree的结构上进行增量挖掘时影响挖掘效率的因素以及FUFP中快速更新FP-Tree实现增量挖掘的策略。本文将基于Apriori的典型增量挖掘算法FUP思想引入TD-FP-Growth算法中TD-FP-Tree的快速更新,提出TD-FP-Tree快速更新算法(PFU-TDFP)。算法通过将所有涉及项分类处理,减少扫描原始事务数据库的可能和次数,且当出现由非频繁转为频繁的项时减少重新排序事务中项所要处理的事务数目,并在某些步骤采用并行处理进一步提高效率。实验表明,本文提出的算法不仅可以快速更新TD-FP-Tree,而且在同基于FP-Tree结构的增量挖掘相比可以进一步提升整体挖掘效率。接着使用PFU-TDFP算法挖掘用户的搜索结果浏览习惯用于查询扩展,使得查询关键词组可以体现用户的行业背景和兴趣倾向,结合元搜索引擎提出个性化元搜索引擎的概念。对元搜索引擎的结果融合提出基于搜索结果的排序、题目和摘要等局部相似度的一种新的结果融合评分模型。最终实现了系统原型,对系统的实验表明,应用PFU-TDFP可以快速更新挖掘用户搜索浏览习惯,本文提出的元搜索引擎结果融合评分公式在P@N方法测试下也会为用户提供更个性化的搜索结果。
其他文献
对结直肠癌患者的术前病情评估对于进一步的治疗和预后等具有重要作用,而近年来不断发展的影像学手段对于病灶的检测有较理想的效果,有利于制定最佳的治疗方案,其中使用较普
电子商务的评价体系能加强产业集群内的惩罚机制和声誉机制,有利于供应链企业形成信任关系,促进群内企业的信息共享。电子商务环境下的供应商管理库存可使产业集群整个供应链
03年末,湛江通过国家旅游局的检查验收,获得了'中国优秀旅游城市'称号.该市旅游发展过程中尚存在一些问题,应进一步完善优秀旅游城市.为此,必须做好五个方面的基础性
智能大厦系统集成可通过数据库、串口、网络等发送或接收各子系统的信息和数据,以完成子系统的控制,但各子系统之间没有统一的信息互联标准和接口标准,很难将各个子系统集成
在初中数学教学中培养学生的创新能力非常重要,首先要培养教师的新意识,这是培养学生创新能力的重要条件,还要培养学生的创新兴趣,这是培养学生创新能力的关键,教师是学生创新能力
<正> 沈大高速公路被誉为“神州第一路”,它北起东北最大的经济中心城市沈阳,南至我国东北最大的贸易口岸—大连,全长375公里。和沈大高速公路并行的还有哈大铁路。在高速公
面对21世纪教育的发展趋势和现代社会对人才的要求,体育教学的指导思想,发生了巨大的变化,从片面的生物学评价向完整体育转变;体育的“阶段性体育”与终结体育向“终身体育”与终
期刊
概述了当今世界数字化艺术的飞速发展以及对人们精神文化生活的积极影响,其中三维人物无疑是人类对自身最美好的投射。然后具体讲解了三维技术越来越普及,但仍存在巨大的空间有待进化。各种媒介上由成熟的三维软件制作的人物广泛为人们所喜爱。最后接单介绍了角色动画的生产流程。
近十多年间,我三次访问美国,最近一次是今年四月。纽约街道两分依然是十多年前那样高楼矗立,华尔街还是那古老典雅的风貌,自由女神像周围,聚集着来自世界各地的游客……,这一切从外
对设备故障管理、分类等进行了详细的分析阐述