基于实体类百科知识的问句自动生成系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qhjiso
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的爆炸式的增长,各种信息充斥着整个网络环境。人们现在已经习惯于去网络上搜寻一些解决问题的方法。当用户并不是十分熟悉一些搜索技巧的时候,他们往往需要花费很多的时间去筛选搜索引擎返回的结果。交互式问答系统的诞生有效的解决了前面提到的信息烦杂的问题。问答系统采用自然语言处理的方法将用户提交的问题进行分析,获取相关答案然后返回给用户。问句自动生成将会在缺少人机交互的情况下为交互式问答系统提供问答对。这些问答对可以根据系统需要限定在某一领域内存在也可以作为通用领域问答对。目前针对英文问句自动生成技术已经有了很大的发展,这些技术已经被应用到问答系统,对话系统以及教学系统等。中文问句自动生成的研究才刚刚起步,有很多的问题需要科研人员来解决。本课题是针对中文问答系统语料库不完善这个问题,提出通过自动的生成中文问答对来对问答系统语料库进行补充。本课题研究内容如下所示:1.中文问句自动生成系统当前,问句自动生成系统不能像人那样直接理解一句话的意思。因此问句生成前的信息预处理是每个问题生成系统所必需进行的。本课题采取分布式设计,将中文信息提取分成两大部分共七类的信息由不同的功能单元机进行处理,最终处理后的结果返回给问句生成系统。本课题设计了一种基于句法信息与句式信息相结合的问句生成算法,根据他们的信息生成特殊疑问句或者是因果关系疑问句。2.生成问句的自动分类本课题提出一种根据对命名实体分类与部分模板匹配的算法,将生成6类问句。这六类的问句分别是人名类问句,地名类问句,时间表达式类问句,机构名称类问句,定义类问句和因果关系类问句。3.系统的评测与改进英文问题生成系统定义了一系列的评测标准。本课题将借鉴其中某些标准来对系统进行评测。同时邀请部分用户参与系统测试,根据他们的反馈情况有针对性的进行系统的完善和补充。
其他文献
联合补充及配送是解决供应链中产品在供应商、仓库和零售商之间调配问题的一种重要方式。随着生产力迅速的发展,人们对商品的需求也随之提高,市场环境中诸多因素都会影响到产品的运输调度。例如,当产品的需求率不确定时,会导致供应商在补充产品时的订购成本发生变化、给零售商配送时所产生的等待成本也变得不确定;当供应商在考虑联合补充中个人的补充成本以及均摊费用时,会以自身利益为前提,这时就需要通过博弈的方式来得到一
随着隐私保护意识的提高,人们越来越重视发布数据的隐私泄露问题。为了使隐私信息尽可能少地被泄露,研究人员提出各种隐私保护手段,不确定性的k-匿名隐私保护模型已经成为数
伴随着用户个性化需求的日渐增多,以及云计算技术的发展,云制造理论得到了发展和重视。基于双边客户资源整合的智慧服务平台是采用了云制造服务模式的应用平台,本课题的研究正是
现实生活中有大量事物可以建模成图数据结构,因此,对于图数据的数据挖掘有很广泛的应用领域和很重要的应用价值。聚类是数据挖掘中十分重要的方法之一,因此,图数据中的聚类问题被
随着科学技术的发展,数字图像处理被广泛应用于军事、遥感、生物医学等其它行业中,近几十年来,它已经成为一门独立的科学技术。总之,数字图像处理技术是一门在理论研究和应用开发
随着互联网的快速发展,很多网络用户在面对巨大的网络信息时,很难快速获取到自己想要的需求信息。为了满足用户需求,个性化推荐系统由此产生。在推荐系统中,协同过滤算法得到了广泛地应用。然而,协同过滤算法建立的用户兴趣模型并没有考虑到用户兴趣会随外界因素的影响而发生变化,以及算法中存在的数据稀疏和实时性问题,这些问题将会影响推荐系统的推荐质量。为了有效解决上述问题,本文主要围绕用户兴趣捕捉、降低数据稀疏度
学位
航迹融合问题是利用信息融合技术,将来自不同传感器的航迹进行有效的处理、关联和综合,估计出较融合前更为精确可靠的目标航迹。航迹融合在战术和战略指挥、控制、通信、监视
随着GIS技术的快速发展,空间数据库在各个领域都得到了极大的发挥,其主要的任务是对空间数据实现有效的存储,进而实现高效访问的目的。空间数据具有海量性、内部结构复杂性、
心肌细胞的数学模型是描述整个器官组织的电生理活动的基础模型。在基础科学和临床诊断研究领域,研究人员使用这些模型来创建心脏的数值模拟,并能取得比较理想的效果。心室的