基于BiLSTM网络的领域问答系统关键技术研究

来源 :湖南师范大学 | 被引量 : 1次 | 上传用户:yuxuan1991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的发展和Web2.0时代的到来,要从海量数据中找寻可靠的信息变得更加困难。得益于大数据和人工智能等新一代技术的迅猛发展,科学的领域问答系统被寄予厚望。领域问答系统将用户的自然语言问句转换为结构化查询语句,通过领域知识库中的三元组获取相关信息,并以准确、简洁的自然语言回答问题,可有效消解用户知识焦虑。由于传统的领域问答系统存在规则制定复杂、特征工程繁琐等不足,将深度学习技术应用到领域问答系统中已经成为了自然语言处理研究的热点之一。针对上述现状,本文研究了基于BiLSTM(Bidirectional Long-Short Term Memory)网络的领域问答系统若干关键技术,主要工作有:(1)针对统计机器学习方法依赖于特征工程,以及卷积神经网络池化后会丢失部分语义信息的不足,本文提出了一种B-CNSR问句分类模型。B-CNSR模型融合了词向量和词性特征得到问句的分布式表示,利用BiLSTM网络和结合静态路由算法的胶囊网络提取文本的上下文时序信息以及局部特征信息,实验的结果表明本文所提出的模型具有更好的问句分类效果。(2)由于中文序列标注任务中存在一词多义和词语没有明显边界等问题,本文提出了一种Bw-BC实体槽位填充模型。Bw-BC模型使用结合上下文词语信息的BERTwwm预训练语言模型动态生成词向量,并利用BiLSTM网络结合CRF算法提取文本的上下文时序信息和相邻标签之间的关系信息,实验的结果表明本文所提出的模型在识别效果上有所提高。(3)本文基于上述两种模型开发了一套面向医学领域的Web问答原型系统。该系统将用户输入的自然语言问句进行问句分类和实体槽位填充,在线生成答案。经试运行检验,该原型系统可稳定实现上述功能,下一步还需要扩充领域知识库,并对系统进行完善。
其他文献
煤层气开采多采用“U型水平井”的开采方式,而玻璃钢作为新型完井管材正被广泛应用于煤层气井水平段完井施工。与常规的钢制套管相比,非金属材质的玻璃钢套管既能保证自身强
随着移动互联网时代的到来,数据量呈爆炸性增长,而数据日渐趋向于非结构化。这些新的趋势给数据存储带来了巨大的挑战。而键值对存储系统由于其简单性、高可扩展性以及高吞吐
氧化镍作为一种优良的P型半导体材料,在电学、磁学、化工等方面应用广泛,是一种有着巨大应用前景的功能材料。氧化镍产品的形貌、纯度、粒度、分散性等微观形貌与使用性能有
伴随着几十年的油田注水开发,国内大多数油藏都进入了特高含水期,这对油藏的进一步开采更加困难。尤其是经历了高压注水和循环注水等过程后,储层压力、地层孔隙结构和流体参
随着对冲基金的迅速发展,对冲基金经理作为影响对冲基金产品业绩的关键因素激发了众多学者对其的研究兴趣。本文参考社会网络分析方法中的结构洞理论,利用经理的工作履历数据
太阳风-磁层-电离层耦合过程是空间天气领域中,人们较为关注的方向之一,也是研究成果较多的领域。在这个耦合过程中,极尖区是磁力线开放的区域,在太阳风-磁层-电离层能量耦合
原油中的甲烷、乙烷、丙烷、丁烷、戊烷等碳数组分含量会因产地、采油层等因素出现较大的差异。针对不同的原油碳数组分含量,应采用不同的方式开采原油。因此,如何准确测量原
本文主要研究的对象是调流控水筛管,调流控水筛管是一种具有防砂和调流功能的复合防砂筛管,通过配置不同直径的喷嘴或孔板,使水平井各段均匀产液,采用商业计算流体软件Fluent
确定平面分段线性哈密顿系统在线性扰动下极限环个数的上界,是弱化Hilbert第16问题的重要研究课题之一.平面分段线性哈密顿系统在线性扰动下的极限环个数与其一阶Melnikov函
玛咖(Lepidium meyenii Walp.),隶属于十字花科独行菜属,为云南重要的药食两用植物。本论文主要是对丽江产玛咖中两类新颖的含硫生物碱开展结构鉴定和仿生合成研究。本论文主要