论文部分内容阅读
作为互联网的重要入口,搜索引擎地位不言而喻而众多搜索引擎有着同样的外表,搜索结果严重同质化个性化搜索引擎通过为用户建立兴趣模型并根据已获得的用户兴趣特征及其历史查询对查询词进行优化扩展,为用户返回量身定做的查询结果,成为搜索领域重要的研究趋势针对个性化搜索引擎不能有效描述用户兴趣特征查询扩展会造成扩展词漂移2个关键科技问题,论文主要研究工作如下:(1)在用户兴趣模型中,针对传统的TF-IDF并未考虑到关键词的位置会对其重要程度的影响,也未区分用户对网页的喜好程度论文提出了基于改进TF-IDF的用户兴趣建模方法实验表明,改进的建模方法不仅能够为用户建立兴趣模型还能够进行实时的更新,能够准确描述用户特征,符合为用户建立兴趣模型的要求(2)在以往的查询扩展中,严重依赖初始查询结果且需要用户的参与,但是往往初始查询结果的相关度并不高造成查询扩展的漂移,使查询不准确针对上述问题提出了查询扩展的方法:利用用户对于所查看网页的兴趣度等信息,选择用户兴趣度的高的历史查询文件作为候选的查询词文档集,并结合用户兴趣模型对查询词进行扩展实验表明,本文提出的方法在查询时的平均准确率比无扩展的方法和基于局部上下文的查询扩展方法要高