基于主题的分布式信息检索集合选择方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yaodanmeidan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断进步,人类创造的数据正以爆炸式的速度增长,传统的集中式的信息检索在面对海量数据时往往不堪重负,分布式的信息检索系统开始越来越受到人们的重视。集合选择的目标是在分布式信息检索中,对于一个给定的查询,在保证检索结果准确度的情况下,选择最相关的部分信息集检索。针对分布式信息检索时用户关心的检索结果往往只在少数集合内的现象,考虑语义关系对检索的影响,本文提出一种基于LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)主题模型的集合选择方法LBCS:该方法使用基于查询的采样方法获取各集合描述信息,然后用基于关键词相关度和基于主题相关度结合的方法估计查询与样本集中文档的综合相关度,再通过样本集文档所属的集合信息,估计查询与各集合的相关度,最后检索与查询相关度最高的部分集合。在实验部分中,选取ReDDE方法和CRCS方法作为基准方法,在TREC数据集上对比了三种方法的检索效果。实验结果表明本文提出的方法能有效选择到与查询相关的集合,相对于两种基准方法有更高的召回率和准确率。
其他文献
随着人工智能、模式识别、数字图像处理等领域的日益快速发展,以及天网工程的逐步实施,智能视频监控技术已经成为人们关注的热点,并逐步发展为一门应用广泛的技术。视频中人
Near Field Communication作为一种近场通信技术在全球发展迅速,已经在世界各地广泛尝试,该技术不仅是普适计算的主要推动者之一,也为计算设备之间安全的数据交换提供了保障
准确地预测城市区域的人口流量,将会为政府和管理部门合理分配城市资源、改善市民出行体验、消除城市安全隐患等提供有效决策支持。城市区域人口流量预测是一个十分具有挑战性
伴随着计算机技术的发展和互联网的普及,人机交互在人们日常生活中显得越来越重要。随着图像处理、模式识别以及计算机视觉等相关技术的不断发展,人们开始研究更智能、更自然
句法分析的任务是根据给定的语法,自动推导出句子的语法结构。句法分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推动作用。  在句法分析的研究中,依存
随着云计算的发展及应用软件的成熟,软件即服务(Software as aService,SaaS)作为云计算的一种应用形式,越来越受到重视,已逐渐成为中小企业应用先进技术的重要途径。SaaS应用交付
随着网络信息技术的发展,互联网数据及资源大幅增加,并呈现出海量特性。为了有效地管理和利用这些海量分布的信息,基于内容的信息检索和数据挖掘近年逐渐成为倍受关注的领域
使用对有种溶解气体分析的方法进行变压器故障诊断,可在变压器运行期进行故障分析的特点,对于变压器维修模式的转变有很大的推动作用,具有重要的研究意义。本文在分析现有变压器故障诊断方法的特点及其存在问题的基础上,将极限学习机算法应用于变压器故障诊断。提出了基于极限学习机的油浸式电力变压器故障诊断方法。分析了不同隐藏层激活函数对极限学习机的诊断性能的影响,给出了诊断的具体实现方法。这种方法有不容易出现局部
随着互联网的不断发展,新型网络应用的不断涌现,特别是语音、视频等多媒体流量的增加,网络信息流量呈现爆炸式增长,带宽资源变得更加紧张,拥塞问题更加严重。另一方面,人们对
智能照明系统在我们的生活中随处可见,一套优秀的智能照明系统不仅能最大限度地节约照明能源,而且能够创造一个良好的、舒适的工作环境,从而提高工作效率。近年来,国家正在大力提