基于语义相似度的查询扩展优化

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:qncy1230s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前导致信息查询质量低下的根本原因在于搜索引擎工具和搜索过程缺乏语义化,用户提交的需求通常是简单的机械式的语法匹配,缺乏语义理解,信息经常会被漏检,误检。解决这一问题,目前通常采用查询扩展技术。查询扩展是指将用户所提交的原始查询词的同义词、近义词等作为扩展查询词,形成新的查询,然后提交搜索引擎进行检索。近来,基于本体的语义查询扩展技术成为了研究的热点。本体论从本质上说是就是对客观存在的概念和概念之间关系的描述,基于本体的查询是基于知识的、语义上的检索,用户所提交的关键词经过一组推理操作,实现同义、上下位、及平级扩展,形成语义丰富的扩展概念集,最后再提交查询。因此,它弥补了传统的基于关键字查询技术的缺陷,从而在查准率上有更好的保证。论文从语义本体角度研究信息查询的模型和分析查询方法,目的旨在实现信息查询技术对语义的支持,最终提高检索的查准率。论文主要研究工作有:研究分析了基于本体的相关信息检索方法,构建了一个基于本体的信息检索框架,提出了基于语义相似度的局部查询扩展技术。基于语义相似度的局部查询扩展技术是在基于局部分析的查询扩展方法的基础上结合本体技术的改进方法。本体对信息的知识化表示使得该技术能够实现对语义的支持,优化了原方法进行局部文档分析的过程,提高了文档分析的效率。在本体技术和局部语料分析方法的双重保证下,提高了最终扩展结果的准确性和相关性。论文还提出了一种将网状本体结构模型优化为树状本体结构模型的方法,提高了语义概念相似度计算的效率。通过转换本体中概念间、实体间的横向联系,实现网络状结构到树状结构的转换,使本体保持清晰的树状层次结构,降低本体模型的复杂度,使本体结构清晰、概念间关系明确,概念相似度的计算也更加简便、高效。论文还使用了分层向量空间模型来对检索文档进行预处理,对分层向量空间模型进行分析后指出了模型原计算公式的错误,进行针对性修改后提出了本文的计算公式。最后利用本体构建工具构建了一个本体实例,通过实验验证本文语义查询优化框架以及相关方法的有效性,检索结果表明,本文提出的基于语义相似度查询扩展技术的检索结果比较全面且准确性高,最终达到了论文提高查准率的预期目标。
其他文献
伴随着移动通信、互联网和计算机等技术结合的日益成熟,以移动支付为代表的移动商务业务发展迅速。作为一种新兴的电子支付方式,移动支付具有快捷、方便等诸多特点,其发展前景将
【摘要】效率是一堂课的生命线,也是衡量一节课成功与否的重要标志。让学生获取更多的知识,锻炼各方面的能力,培养丰富的情感,养成良好的学习习惯,是构建高效课堂之目的所在。  【关键词】课堂;教学;效率;参与  一、万万丈高楼平地起。备课“三备”求一个“实”字  做为一名语文教师,备课前要做到“三备”与“四明”:备课要“备教材”,更要“备学生”,看一个班的整体学习程度,还要“备教法”,力求备课准确到位,
【摘要】在课堂教学中,教师只要紧扣文本,抓住教学重难点,善于启发,引导学生学方法,找规律,学生自主学习的能力就会逐步养成和提高。  【关键词】语文;启发;自主学习;教学  自主学习是新课程改革积极倡导的学习方法之一,是合作学习、探究学习的基础和前提。没有充分的自主,就不可能实现有效的合作,更谈不上深入的探究。  以下,我以《小巷深处》的教学为例,简要谈谈我在培养学生自主学习能力方面的一些粗浅的作法
【摘要】本文旨在研究初中物理教学中新课导入的有效教学方法,针对出现问题提出相应的解决策略,为我国初中物理教学在新课导入教学方法方面的进一步发展提供一些可行性的依据。  【关键词】初中;物理;导入;教学;策略  高效务实的课堂一直是教学新理念追求的理想目标,如何优化课堂教学的过程,从而不断提高课堂教学的效益,是广大教师必须面对的现实问题。物理学科由于其本身的特点,学科知识紧贴学生的生活实际,很多知识
自1973年以来,我们连续五年对宁夏引黄灌区春小麦的幼穗分化过程,幼穗分化与植株营养生长之间的关系,影响每穗小穗数和结实粒数的关键时期,以及水、肥、密栽培技术措施对于
全球化、社会、政治、经济的压力,技术创新、产品创新和管理创新的快速发展,使产品的生命周期大幅度缩减。客户对产品的需求已趋于多样化、迅速化和定制化,为更好、更快、更高效