基于潜在语义分析的查询扩展研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:helinjue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询扩展是信息检索研究的关键技术,是改进并提高信息检索效率的重要方法。鉴于用户知识表达的差异性、检索环境的多样性,用户往往需要尝试多次构造查询语句才能查询到理想的目标文献。传统查询扩展方法主要致力于同义替换原查询语句中的各个词语,但实践中这种扩展思想难以适应“一词多义”和“一义多词”的自然语言现状。潜在语义分析是一种知识获取和表达的方法,利用统计方法提取词项间的潜在语义结构,依赖矩阵运算可使语义相近的文献在多维空间中映射得近一些。将潜在语义分析技术应用于查询扩展处理中,能更好的挖掘并表达原始查询的语义,提高检索效率。本文介绍了查询扩展研究的国内外现状,通过比较各方法的优劣提出目前查询扩展的不足是无法准确表达查询语句的语义信息。文章引入潜在语义智能型检索方式,阐述了潜在语义分析法的产生背景、基本原理,结合语义词典的扩展优势和概率潜在语义分析技术,提出一种新的查询扩展方法。用小样本对方法进行测试,证明了该方法的可行性和有效性。论文的研究工作主要包括以下几个方面:(1)分析查询扩展研究的必要性,对国内外研究现状进行文献调研和总结,从计算复杂度、检索效率等方面分析比较目前各扩展方法的优势和不足,提出了现有查询扩展方法的局限性;(2)介绍了基于语义词典的查询扩展方法,分析了基于语义词典查询扩展方法的有效性和便捷性,该方法是查询处理模块应用语义词典的理论基础;(3)介绍了潜在语义分析、奇异值分解等方法的理论基础,经潜在语义分析削弱了同义和歧义对检索有效扩展的影响。用小样本集测试了潜在语义分析查询扩展的效果,也分析了尚可改进的不足之处;(4)逐步深入探究基于潜在语义分析的查询扩展,提出以概率潜在语义分析为主结合语义词典优势的语义查询扩展方法。文本聚类后在相关簇内查询扩展,与现有的几种流行扩展方法对比,该方法的查全率和查准率更理想。今后将以本文研究为基础,把该方法应用到检索模型,实现更广泛应用。
其他文献
<正>【导语】通江构建了具有秦巴山连片扶贫区域特征的脱贫攻坚长效机制一栋栋巴山新居优雅别致、一条条宽阔的水泥路进村入户、一串串"绿宝石"青翠欲滴、一张张幸福笑脸让人
<正>学习贯彻全国、全区宣传思想工作会议精神,努力开创内蒙古宣传思想文化工作新局面,"要"在守正,"贵"在创新,"重"在实践。秉持初心,一以贯之。推动宣传思想文化工作强起来,
本文从语义、句法和语用几个方面比较分析了感叹句中“多(么)”和“太”的差别,认为“多(么)”着眼于描述现实的性状、含有夸张的语气;“大”含有比较和确认的语气。“多A啊!”和“
提出了一种顾及设计矩阵随机误差的最小二乘组合解法(combined least square,CLS),该算法适用于整体最小二乘(TLS)的参数估计。给出了整体最小二乘平差新算法下的精度评定公
随着信息技术的发展,图书馆的网络化和数字化也得到了进一步的推进。与传统的图书馆服务模式相比,现代化图书馆服务模式能给用户提供更加快捷高效优质的信息服务,其中图书馆网站
针对具有较强非平稳性和易被强烈背景噪声干扰特点的滚动轴承振动信号,提出了基于短时傅里叶变换和卷积神经网络的故障诊断方法,实现了端到端的故障模式识别。首先,对滚动轴
<正>翠绿欲滴的有机韭菜、鲜红剔透的新鲜草莓、五彩斑斓的彩色辣椒……这些过去只有在特定收获季节才可见到的瓜果蔬菜,如今在山东省邹城市香城镇小山阴村有机蔬菜基地里比
以酸乳为原料配以中草药,开发解酒乳酸发酵饮料。试验结果表明,该饮料解酒效果显著,有一定开发和市场推广价值。
天仪再始,岁律更新。过去一年,西宁市宣传思想工作以习近平新时代中国特色社会主义思想为指引,牢固树立“四个意识”,不断坚定“四个自信”,自觉把“两个绝对”作为西宁坚决