HNC理论和随机模糊在问答系统中的应用研究

来源 :江苏大学 | 被引量 : 1次 | 上传用户:hbdltx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet上信息量的飞速膨胀,使得人们在网上查找自己需要的信息变得越来越困难。虽然一些搜索引擎(如Google、百度)为人们从海量的网页中迅速查找有效信息提供了工具,但是现有的搜索引擎使用的信息检索技术大部分都是基于关键词匹配,这样使得搜索结果存在大量冗余和无用的信息,影响了返回结果的准确率。本文讨论的QA(Question Answering)系统试图改变这个情况,它不仅能有效利用Internet这个庞大的信息资源库,而且利用概念层次网络(Hierarchical Network ofConcept,HNC)理论,使得返回结果更加丰富和精确。从目前国内外研究情况看来,QA系统质量很难令人满意,原因在于两方面:其一,QA系统问题分类不精确导致最终答案与问题主题偏离;其二,现有的候选答案抽取技术大多基于统计的方法,忽略了句子的语义,影响了答案的准确率。针对这些不足,本文从问题分类和候选答案抽取两个方面进行研究,首先提出了一种基于HNC理论和随机模糊理论的随机模糊树模型,从而能够更好的处理HNC的五重模糊问题,使得计算机对自然语言的理解更加的到位;其次,本文提出的基于HNC理论的多策略答案抽取算法,将HNC符号的概念层次网络信息引入到答案抽取算法中,从而提高了生成答案的质量。本文的主要研究成果可以归纳为:(1)结合随机模糊理论和HNC理论,提出了一种随机模糊树。通过计算随机模糊树的句类本原机会,可以在一定程度上消解HNC的五重模糊问题。(2)提出了一种基于HNC理论的中文问题分类方法,利用HNC的概念层次网络信息同时句类分析知识和随机模糊语义消岐知识对中文问题进行分类。适应了汉语表达方式的多样性和复杂性。(3)提出了一种基于HNC理论的多策略答案抽取算法,利用同义词替换丰富候选答案的语义,改进了语句概念相似度的计算方法,并将其与模式匹配结合在一起。一定程度上提高了答案抽取的获取率和准确率。(4)以上海现代所综合业务应用为背景,实现了一套中文QA系统原型系统,与传统的QA系统进行了对比进行了对比实验,初步验证了本文算法在模糊歧义消解方面比传统QA系统更加有效。
其他文献
工作流是指部分或者整个业务过程在计算机支持下的全自动或者半自动。工作流关注的核心是过程,它提炼出信息处理的过程,然后研究其性质、结构和实现等。其主要解决的问题是能
计算机视觉是利用摄像机和电脑替代人眼的一门学科,具有对目标进行分类、识别、追踪和判断决策等功能。近两年来,随着“德国工业4.0”和“中国2025计划”的推出,加快了以智能
作为模式识别的核心课题之一,特征提取重点研究如何有效地、准确地描述物体对象,可以将不同类的物体有效分开。特征提取的好坏,直接关系到模式识别最终的结果,因此特征提取是
无线传感器网络的研究起源于二十世纪七十年代,主要应用于军事领域。伴随互联网技术、嵌入式计算技术、无线通信技术和微机电系统技术的迅速发展,无线传感器网络已成为当前国
空间电磁悬浮是一种重要的无容器加工技术,对于材料制备和研究有重要意义。   论文首先概要叙述了电磁悬浮技术的发展情况。然后分析了电磁场中样品的所受电磁力,分析的结
学位
随着移动多媒体技术的快速发展,用户对移动终端所提供的服务提出了多样化的需求。然而,移动设备的各种硬件问题也随着新业务的不断发展而不断显露。比如伴随着信息量的增加,
目前,各种软件工具及不同系统间交换或存取元数据是一个研究热点。本文在CWM元模型基础上,借鉴P/S技术的思想,将P/S应用到元数据互操作中,针对web数据仓库开放分布的特点,给
SQL注入攻击作为Web应用程序面临的一类最常见的攻击方式,对于其检测技术的研究已经受到越来越多的关注。为了解决现有基于应用的SQL注入检测技术容易产生误报且忽视对存储过
随着多媒体信息技术和数字化图像设备的不断发展,人们可以很方便地以图像的形式获取到现实世界中的景象,越来越多的图像信息出现在人们的日常生活当中。而在日常生活中,人们对于
随着计算机软件技术的不断发展,软件体系结构和开发方式也在发生着重大改变。为了能使程序编制人员高效率地进行软件开发,研发出质量高、扩展性强、便于维护的软件产品,人们