基于搜索日志的查询推荐算法研究

被引量 : 0次 | 上传用户:ldfzcc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
种类众多、数量庞大的信息每天都会发布到网络中,网络成为海量信息资源的载体,人们已经越来越习惯于通过网络寻求答案、文章、产品、人物和地点等诸多事物。搜索引擎正是实现这一过程的一种基本应用,而在丰富多彩的网络信息中,如何找到用户真正需要的、有用的信息,时刻困扰着人们,为了解决这一实际而有意义的问题,引出了本文的研究重点—查询推荐。查询推荐通俗解释也就是:为了满足搜索引擎用户对提高其搜索意图及定位准确性的迫切需求,结合用户所提交的检索词和用户后续行为,采用一定的策略和算法为其推荐合适的检索词的过程。可以说在查询推荐在提高搜索引擎可用性方面,扮演着很重要的角色。在本文中方法的设计和实现过程中,熟悉并掌握了搜索引擎的工作原理以及体系架构,同时以自然语言处理技术和Web信息挖掘技术为理论指导,以搜索日志为数据分析对象,重点研究搜索引擎个性化服务功能中的查询推荐技术。本文所采用的方法中分为两阶段,为保证在线推荐的实时性,设计了离线处理阶段,实现数据预处理、构建用户查询—点击二部图、二部图聚类等操作。第二阶段是在线推荐阶段,实现基于用户日志的查询推荐。经过实验表明,本文所提出的方法不仅保证了查全率,而且提高了查准率。
其他文献
产业内贸易作为一种新兴的贸易模式在短短数十年间有了非常迅速的发展,对产业内贸易程度的测量研究一直是产业内贸易理论领域的一个主要问题。本文通过G—L指标、产业内贸易
矿床分布于九甲-墨江断裂带中,单个矿体产于F_1、F_2两断裂所夹持的上古生界浅变质沉积岩系与南西侧浪泥塘-麻子村超基性岩体的接触带附近,矿体严格受断裂(F_1、F_2)控制,其规
针对单目标优化算法求解爬虫问题时难以获得最优加权因子和易于陷入局部最优的缺点,将多目标优化算法引入主题爬虫,提出一种基于多目标优化的网页空间进化算法。通过计算测试
目的:观察心痛宁方加味治疗不稳定型心绞痛(气虚血瘀证)的临床疗效。方法:将46例不稳定型心绞痛(气虚血瘀证)患者采用心痛宁方加味治疗,2周为1个疗程,连续治疗3个疗程后评定疗效。结
在经济全球化大趋势下,西方发达国家为稳定和发展自身贸易,采取一系列的侵略性措施保护贸易经济,诞生了新贸易主义,同时这些措施给我国的出口贸易带来了不小的影响,因此需要
<正>蒲松龄一生著述颇丰,概括起来,可分三类:一是小说,二是《农桑经》一类的杂著,三是戏曲、俚曲.在路大荒《蒲松龄集》所收戏曲、俚曲作品中,固不乏批评现实,抨击黑暗的作品
马克思主义的实践观对于当代社会生活有极其重要的方法论意义。一是认识货币的本质:货币作为充当一般等价物的特殊商品,也是使用价值与价值的统一。其使用价值是充当流通手段
文章针对Fluent中气固两相流离散相模型(DPM)仿真,以文丘里管内流场为例,在结合气相流场分析与固相颗粒受力分析的基础上,提出DPM模型优化的4项措施,即从颗粒所受各个力的合
通过在刚升格的高职院校中,建设具有"职业特色"的校园文化,让学生在走进职业岗位前就熟悉企业的文化和管理,具备其行业应有的职业素质。以调查问卷形式了解高职护理专业学生
为研究财政农业支出对我国农村居民消费影响的相互关系,本文分别从财政农业支出总量和结构两个角度出发建立数理模型,采用协整分析与误差修正模型的检验方法对财政农业支出总