基于本体的农业自动应答系统关键技术研究

来源 :河北农业大学 | 被引量 : 7次 | 上传用户:fawudai111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,信息获取成为人们工作生活中的重要组成部分,因此也极大地推动了自然语言处理技术的发展,同时也对自然语言处理技术提出了更高的要求,如何在网络世界中快速、准确地获得服务是研究的一大难点。自动应答系统正是在这种情况下产生发展的。自动应答系统是搜索的一种形式,并且对于传统的搜索形式应答系统能更好的改善搜索质量。目前国内的应答系统尚处于探索阶段,较低的自然语言处理水平和人工智能的发展水平制约了自动应答系统的智能水平。现有的自动应答技术比较集中在对用户的输入问句进行关键词的检索匹配,对其中的关键部分—语义理解涉及的不是很多。针对上面问题,本文提出引入领域本体作为语义理解的基础。本体(ontology)是一种用来描述概念及概念与概念之间关系的模型,包含领域的较完整的知识和丰富的语义关系,把这些资源通过方法应用到应答查询中,使得一定程度上帮助解决语义理解不足的问题。文章通过构造一个小型的本体来协助完成问题的理解、检索以及问句间的语义相似度计算。确定本体的范畴,提取领域中的概念,定义概念属性及相互关系,用本体描述语言描述本体,确定本体的存储方式。对应答系统进行模块设计,建立问题—答案库,并在本体提供的知识背景下对用户和问题—答案库中的问句进行分析处理,提取问句的句型和中心概念及扩展概念集,设计检索方案,在问题—答案库中查找候选问句集。将得到的问句集与用户问句进行语句相似度计算,将结果值高于阈值的问句—答案对作为结果返回。目前普遍使用的语句相似度算法倾向于基于统计的方法和基于语义词典的计算方法,前者不考虑词语本身携带的语义信息,后者则受词典本身的限制。因此在借鉴现有算法的基础上,文章提出使用基于本体的语义相似度计算方法,主要讨论并构造了概念之间和问句之间的语义相似度计算模型。概念间相似度算法主要通过对本体中不同概念之间的各个属性进行对比,判别它们在各个属性上的相同与否来得到概念间的语义相似度,同时对其近邻概念集进行相似度比较,最终加权得到线性方程来确定概念在领域本体背景下的相似度。为了保证在概念数目较多时的计算精度,文章引入禁忌算法来寻找最优解。在得到概念间相似度的基础上设计问句向量模型,借鉴向量空间计算方法来得到问句间的相似度。最后介绍系统原型并通过实验分析,证明算法的正确性和有效性。
其他文献
人脸检测与识别技术是人工智能和机器视觉领域内最具挑战性的研究课题之一。让计算机可以像人类一样能够记忆、识别人脸一直是众多计算机科学工作者追求的目标。人脸自动识别
近年来,随着信息技术的快速发展、网络传输速率的大幅提高、以及移动通讯设备的逐渐普及,移动增值业务作为移动应用的一个主要方面,得到了空前的发展。 在名目繁多的增值业务
随着社交网络的飞速发展,越来越多的用户参与到微博等在线社交活动中。微博实时更新的热点话题,是与社会事件和人们关注的焦点有密切关系的。提炼微博话题的情感摘要,可方便
多媒体技术和Internet技术的普及导致了大量图像信息的出现,传统的文本关键词检索方法已经不能适应图像信息的检索需求,基于内容的图像检索技术成为目前研究的热点。本文在对基
随着信息时代的来临,互联网上的海量信息给人们的工作、学习、生活带来了诸多便利,但是网络上还充斥着许多含有色情、反动、暴力等内容的敏感信息,对青少年的成长甚至对社会秩序
Internet技术的迅速发展使得网络成为人们获取知识的主要途径之一。近年来,E-learning的应用和研究领域飞速发展,为用户提供了前所未有的丰富的学习资源和灵活的学习方式,同时使
在过去的十年里,随着 IEEE802.11p标准和IEEE1609标准的出现,一些智能交通系统的传输结构正在发生改变。一种新型的网络--车辆自组织网络(VANET)也应运而生。VANET是移动自组织网
知识融合算法是知识融合的核心部分,其目的是将多个知识库进行融合,形成新知识库。在人类认知的世界和各应用领域中,很多概念是模糊不清的,不再是精确表示的。模糊知识融合算法过
随着信息时代的到来,互联网正深刻地影响着人们的学习、工作、生活娱乐等各个方面,也改变了人们日常的沟通表达方式,网络新词的不断涌现就是一个很好的证明。在印欧体系语言
Ad Hoc网络是指由一组带有无线通信收发装置的移动节点组成的一个多跳、自组织、无中心网络。随着Ad Hoc网络中节点的快速移动,网络的拓扑结构会不断变化,因而传统的用于因特网