用户兴趣模型驱动的个性化搜索引擎的研究和实现

来源 :湖南工业大学 | 被引量 : 0次 | 上传用户:wplyaq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为互联网的重要入口,搜索引擎地位不言而喻而众多搜索引擎有着同样的外表,搜索结果严重同质化个性化搜索引擎通过为用户建立兴趣模型并根据已获得的用户兴趣特征及其历史查询对查询词进行优化扩展,为用户返回量身定做的查询结果,成为搜索领域重要的研究趋势针对个性化搜索引擎不能有效描述用户兴趣特征查询扩展会造成扩展词漂移2个关键科技问题,论文主要研究工作如下:(1)在用户兴趣模型中,针对传统的TF-IDF并未考虑到关键词的位置会对其重要程度的影响,也未区分用户对网页的喜好程度论文提出了基于改进TF-IDF的用户兴趣建模方法实验表明,改进的建模方法不仅能够为用户建立兴趣模型还能够进行实时的更新,能够准确描述用户特征,符合为用户建立兴趣模型的要求(2)在以往的查询扩展中,严重依赖初始查询结果且需要用户的参与,但是往往初始查询结果的相关度并不高造成查询扩展的漂移,使查询不准确针对上述问题提出了查询扩展的方法:利用用户对于所查看网页的兴趣度等信息,选择用户兴趣度的高的历史查询文件作为候选的查询词文档集,并结合用户兴趣模型对查询词进行扩展实验表明,本文提出的方法在查询时的平均准确率比无扩展的方法和基于局部上下文的查询扩展方法要高
其他文献
管道作为一种特殊的承压设备,广泛运用于石油、化工、冶金、电力等行业及城市燃气和供热系统中。在日常生产中,由于对管道的管理重视不足,由管道引起的生产事故频繁发生。而且目
虚拟手术是一门综合性的学科,涉及到医学,计算机图形学,生物力学,机械动力学,材料科学等诸多领域。虚拟手术的主要目的是在原始医学图象的基础上,利用可视化技术在计算机内构
随着Web服务技术的发展,面向服务架构(SOA)已经从一个难以实现的设计理念逐渐变为业务解决方案中重要的设计方法。然而,只有能够将现有服务进行灵活组合才能真正发挥SOA的优
高维数据正越来越多地充斥于数据挖掘领域,解决高维数据学习问题的传统方法是应用特征选择方法,尽可能地选择一个最小的特征子集(特征模型)来精确地描述学习数据。然而现存的
无线传感器网络由许多传感器节点组成,其节点部署在比较危险的区域如:山区、矿井、核电站等,它具有体积小,重量轻,存储能力有限,计算能力有限,能量有限等特点,故如何高效的使用传感器
随着流媒体技术和对等网技术的发展,研究人员提出了P2P流媒体技术,即把组播的功能从网络层移到了应用层。与传统建立在客户-服务器模式基础上的流媒体技术相比,P2P流媒体技术
随着网络存储技术的飞速发展和广泛应用,各种网络存储系统的性能分析和研究成了当前国内外研究的热点。相应的,各种网络存储协议的重要性也不言自明。从最初的Fiber Channel协
随着计算机与网络技术的广泛应用,计算机网络已经在社会、经济、文化和人们的日常生活中扮演着越来越重要的角色,越来越多的政府、商业、金融等机构和部门将自己的数据库连接到
随着Internet和电子商务的飞速发展,可扩展标记语言XML成为了数据表示和数据交换的事实标准。XML具有自描述性、简单性、可扩展性、可重用性和开放性等特点,越来越多的数据和信
彩铃业务是个性化多彩回铃音业务(Coloring Ring Back Tone)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。该业务有很强的