问答系统中问题拆分技术研究

被引量 : 0次 | 上传用户:shanshan0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统以精确答案直接满足用户以自然语言方式表达的信息需求,日益得到重视。尽管近年来发展迅速,但当前的问答系统仍然主要处理描述简单的事实型问题,而用户在实际生活中往往会提出具有一定的约束,包含多个事实的复杂问题,传统的问题理解方法无法有效分析这类问题,导致答案抽取质量较低。因此,对复杂问题的理解是自动问答继续发展过程中需要解决的难点。本文专注于包含多个事实的复杂事实型问题,试图对原问题按照一定策略拆分为若干个子问题,通过依次解决子问题,最终得到原始问题的答案。目前对该方向的研究刚刚起步,问题的定义和解决方案均不够成熟,很少有工作系统地处理这一问题。本文针对复杂事实型问题的拆分,主要在以下3个方面进行研究:1.从语言现象上深入理解问题子问题的性质、特点和相互依赖关系,从真实数据出发,进行了复杂事实型问题拆分的语料库构建,明确了子问题标注体系及标注方法。2.针对如何进行问句拆分的问题,根据子问题体现的语言学特点,提出了基于依存句法规则的子问题候选获取方法,总结和概括了一系列依存句法规则抽取子问题候选,力图覆盖问题中主要事实,并建立子问题之间的依赖关系。3.针对问题拆分候选较多的问题,提出了基于句子流畅度和句法模板的子问题验证方法。利用基于Web的NGram获取方法衡量子问题的流畅程度,通过从大量人工标注的子问题实例中统计归纳句法模板,对子问题候选进行排序,获取高质量的子问题候选。总之,本文针对问题分解这一课题,主要从概念和语言的角度进行了初步探索,所得到初步观察与结果未来可应用于复杂事实型问题的答案抽取。
其他文献
当前,我国大学生职业生涯规划教育正在兴起。不仅很多大学开设了职业生涯管理课程,而且加强了对大学生职业生涯规划的指导。同时,我国的大学生思想政治教育已经相对完善,我国几乎
刘克庄现存题跋文400多篇,其题跋文不仅数量上极为可观,质量亦高,被视为宋末的最后一位题跋大家,《四库全书》更称其在题跋文的创作上独擅胜场。本文立足文本,对刘克庄题跋的
该文利用EOF分解得到的1982—2001年西南地区夏季平均、最高和最低气温的时空特征显示,西南地区夏季平均、最高气温的时空变化具有很好的一致性,尤其是川渝地区20世纪80年代
甄别中药要尽量去避免用人工的方法,用中药饮片固有的图片信息进行科学地分辨和识别是最合适的,此处涉及了基于内容的图像特征提取,图像底层特征主要有三个方面,分别是纹理特征,颜
心理弹性研究的开展至今已有30多年,已经被确定为是心理学研究中的一个重要领域,越来越多的研究者加入了研究的行列。贫困大学生是高等院校的一个特殊群体,他们不但和非贫困大学
在强调创新发展的今天,创新能力成为企业构建其竞争优势的新途径。如何在大环境下促进团队创造力的发挥成为学者和管理者们的关注热点。团队认知能力能帮助团队在运作过程中指
背景糖尿病是妊娠期常见的合并症,影响着约7%的孕妇。妊娠期糖尿病是指妊娠后发生的或首次发现的不同程度的糖耐量异常。我国妊娠期糖尿病的发病率为1.31~3.75%,并呈逐年上升
五四时期,中国思想文化界异常活跃,“问题与主义”之争持续时间不长,但却触碰到一些时代所关注的焦点和热点,其发生在五四时期的大背景下,事件当事人李大钊和胡适在论战中各自表达
目的:直肠双面探头在前列腺穿刺活检中的临床应用价值研究分析。方法:选取我院2015年5月—2017年5月收治的下前列腺穿刺活检患者100例的临床资料作为研究对象,运用回顾分析法
随着问答社区网站的兴起,越来越多的用户生成数据积累了起来。这些用户生成数据不仅具有海量的、多样性的等特点,还有着极高的质量和重用价值。为了高效的管理和利用这些数据,近