基于非结构化文档理解的问答技术研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:wt920997920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术和大数据技术的发展,问答系统的研究有了很大进展。问答技术是问答系统成功的关键,它通过更好地理解用户提问的真实意图,给出简洁准确的答案,更有效地满足用户对信息的需求。目前互联网上海量非结构化文档蕴藏着的知识可以很好地帮助问答,关于非结构化文档的问答技术还有很多值得研究的问题。本文综合当前的研究成果,探讨了文本理解技术,提出了基于非结构化文档理解的问答方法和模型,并通过实验进行验证分析,本文的主要工作和研究成果包括:1.探究了问句的理解方法,提出了一种通过训练问句和答案对得到问句表示向量的模型和一种获得其关系表征的关系抽取模型,并通过显式和隐式的表征更好地理解问句。2.对于以非结构化文档中句子作为答案的问答问题,采用远程监督学习构建了一个问答数据集,并提出了一个基于理解表征和信息检索的排序学习问答模型。首先利用显式表征对问句进行扩展,提高召回,再将隐式理解得到的向量表征作为特征加入到排序学习中,实验表明问句理解能有效地提高非结构化文档问答的效果。3.对于以短语片段作为答案的问答问题,将从非结构化文档中抽取片段式的答案转化成确定答案片段的起始位置和结束位置分布的问题,提出了基于深度学习的理解模型,依赖起始位置信息改进了确定结束位置分布的网络结构,在输入词单元的基础上创新性地引入了字符和依存句法信息的理解。实验表明,在SQuAD数据集上,该模型与当前优秀的模型相比有显著的提升。本文将当前自然语言处理领域热门的理解研究与非结构化文档的问答结合起来,对于开放领域问答的研究有实质性的意义。
其他文献
内部控制质量越高,企业风险越小。建立健全内部控制制度,对防止地方政府投融资平台出现财务危机、阻止投融资平台风险转嫁具有重大的实践意义。当前,地方政府投融资平台内部
最近,加拿大多伦多大学生物科技教授与华裔研究生通过合作研究,找到了检测DNA的初步工具。可测致命疾病及空气、水和液体中的病菌,给医院及执法人员提供了防范生化袭击和非典型
生长因子是促进养殖动物整体和内脏器官生长发育的重要活性物质.有的饲料或饲料添加剂中含有生长因子,可直接发挥作用;有的饲料添加剂不含有生长因子,但进入动物体后可诱使动
“农业兴、百业兴:农村稳、天下稳;农民富、国家富”。如何正确认识和处理农业、农村与农民问题,始终是国家兴旺发达的根本问题。“建设现代农业,繁荣农村经济,增加农民收入”是对
历时地看,以"象征性"元素传递和发展中国传统文化的传播方式和社会功能,既是一定地理文化与社会生活相关联的外在性反映,也是相关区域民间文化元素通过自身渠道调节社会关系,
移动购物是指用户以手机为终端,通过移动通信网络连接互联网进行的电子商务活动。在技术接受模型和认知资源理论基础上,探析了时间压力对移动购物意愿的影响机制,研究发现:时
<正> 阿姆斯微生物肥料是一种多元的、新型的微生物有机复混肥,除含有高效的固氮、解磷解钾活性微生物外,还含有丰富的有机质和微量元素。它既有无污染、无公害、肥效持久、
协调是一种实践活动,是秘书主体发挥职能作用以保证政策顺利实施的实践活动,充分体现了秘书主体在对美的规律的把握中,积极主动地创造美,追求和谐美的审美意识和审美理想。笔
解说:AP是世界热带名果番荔枝杂交后代的英文缩写.它喜欢生长在热带和亚热带地区,具有花期长、稳产、丰产、病虫害少的特性.