基于关联规则与聚类算法的查询扩展算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:nana9816245
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对信息检索中查询关键词与文档用词不匹配的问题,提出一种基于关联规则与聚类算法的查询扩展算法。该算法在第1阶段对初始查询结果的前N篇文档进行关联规则挖掘,提取含有初始查询项的关联规则构建规则库,并从中选取与查询用词关联度最大的置个词作为扩展词,与初始查询组成新查询后再次查询,在第2阶段将新查询结果进行聚类分析并计算结果中每篇文档的最终相关度,按最终相关度大小重新排序。实验结果表明,该算法比单独使用关联规则算法或是单独使用聚类算法均有更优的检索性能。
其他文献
文章以自然界的生态系统结合lotka-Volterra模型为基础,分析了产学研共生演化过程中生成期、成长期、成熟期以及衰落期的阶段性特征与发展趋势,并在此基础上对产学研相互竞争
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用干文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类
如果说公平公正是任何大赛的生命,那么裁判员正是这个"生命"的守护者和捍卫者。此次第七届全国交通运输行业"宇通杯"城市公交驾驶员职业技能竞赛的裁判员个个都是专业的,且抱着公
针对现有方法在编码含丰富细节信息的图像时编码时间长,编码小尺度子块时压缩率不高的缺点提出改进方法。该方法是基于Jacquin编码的理论,采用对编码子块划分为细节和非细节部分子块的方法,从而减少编码子块的数量,缩短编码时间,提高在小尺度子块划分下图像的压缩率。结果证明,对于含丰富细节信息的图像,子块数量减少到1/3,编码时间缩短1/3。
针对传统Agent协商策略学习能力不足,不能满足现代电子商务环境需要的问题,采用Q-强化学习理论对Agent的双边协商策略加以改进,提出基于Q-强化学习的Agent双边协商策略,并设计实
目的:研究α-亚麻酸、植物甾醇酯复方牛奶的降血脂作用。方法:将受试者按血脂水平随机分为复方牛奶试食组和安慰剂对照组,其中对照组51例,试食组53例,以双盲法进行实验。受试
这一年,时间过得很快,公路行业的每一点变化都聚焦在时间的目光下。从示范工程的众望所归之收官,到建设营运企业的转型试水;从“标准化”的遍地开花,到新的管理体制建功立业;从对“
摘 要:生物一直以来就是理科中的文科,简单的记忆背诵,就可以取得好成绩。但是,有些淘气的初中生,面对这些文字类的背诵,他们是不乐意的。那么,面对这样的问题,初中教师该如何继续开展工作呢?本文就如何提高初中生对生物的学习兴趣展开论述。  关键词:初中生;生物学习;学习兴趣  当学生从小学踏入初中,就接触生物这一门新的学科。面对新学科,有些学生会感到恐惧,害怕自己学不好。有些学生或许会感到兴奋,因为可
对形如(x1:x2,[-∞:y])的二维查询问题,提出一种快速的、易于实现的动态优先搜索树数据结构及其相关算法,采用只在叶节点存储数据的结构,以及在常数时间内实现旋转操作的算法。设n为
针对大规模地形数据庞大、绘制速度慢的问题,提出一种基于数据分块和包围球误差函数的地形绘制方法。该方法对数据进行分块组织,按行列顺序对数据块编号,实现对地形数据的部分读取。依据视点可见性判断,实时调入可见数据块,设计一种基于包围球的误差函数,通过三角形二叉树构建层次细节模型,实现大规模地形实时绘制。实验结果表明该方法可以取得较高的帧速率和较好的绘制效果。