基于用户查询意图识别的个性化搜索方法研究

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:pcy1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  传统搜索引擎进行信息检索时,经常会返回并不完全符合用户查询意图的海量搜索结果.因此,高效识别用户查询意图是大数据时代对个性化搜索和推荐提出的新挑战.故本文提出一种基于用户查询意图识别的个性化搜索方法,即利用搜索语料库的公共LDA模型和时间维度构建用户模型,并利用查询主题和用户模型识别其查询意图,最后,结合用户查询意图和局部共现进行查询扩展.实验结果表明,我们的方法和ICA-QE,Lucene相比,Precision@5值分别提高7.1%,14%,Precision@10值分别提高7.4%和13%.从而能针对不同背景的用户,从海量的数据中检索出符合其个性化需求的查询结果.
其他文献
为了促进干旱区林果业的发展,创建水资源高效利用环保型生态林果业。本研究利用全生物降解膜套袋种植技术在吐鲁番市亚尔乡建立了生物降解膜杏树节水种植示范区。本试验对全
  现有的大部分分类算法都是针对多维数据的,虽然存在一些方法可以用于不是用多维表示的数据类型,即非多维数据,但这些方法本身的弱点往往也都很明显。在大数据时代,复杂的数据
会议
  随着文本数据量变得很大且仍在迅猛增加,自动文本分类变得越来越重要。为了提高分类准确率,特征词权重计算方法是文本分类领域的研究热点之一。我们研究了各种特征词权重
会议
本文简要介绍了MBS树脂的性能、重点研究了采用种子乳液聚合工艺合成了具有核-壳结构的PVC高透明、高抗冲型改性剂MBS树脂的过程,对影响种子乳液聚合反应的乳化剂、电解质、
  The goal of postharvest research is to optimize and extend fruit storage and quality.Common parameters measured include texture,sugars,acids and flavor vola
会议
  针对海量视频检索,提出一种结合Bloom Filter和SimHash的视频相似性检索方法。采用SimHash算法对视频关键帧构建特征,从而将海量视频检索问题转化为汉明距离检索问题,在此基
会议
  近年来,社交网络的飞速发展,促进了金融信息的广泛传播,互联网已经成为了股民获取股票相关信息的主要渠道。因此,研究这些文本信息对股票的影响变的尤为重要。基于时间序列研
  本文提出了一种基于词序的社会情感演变分析模型(BTMESE),模型通过引入文档中词与词之间的前后关联性,以期有效地揭示时间、文本、情感三种信息之间的潜在联系,进而追踪社会
  Fruit ripening in Actinidia sp(kiwifruit)is complex,and atypical.Many of the fruit ripening associated processes(starch breakdown,flesh colour change,and in
会议
  随着Web2.0发展,用户成为网络内容的主创者,每天都有海量数据生成,其中包含大量新词.因此,本文提出一种基于词语相关度的微博新情感词自动识别方法.由于分词软件常把一个新词
会议