【摘 要】
:
知识库问答旨在通过解析用户的问句直接在知识库中提取出相应的答案,相比于传统的网页搜索可以极大提高用户的检索效率。传统知识库问答方法需要设计大量的规则和模板将用户的问句转化为结构化的表示,并不适用于大规模的知识库。深度学习凭借其强大的特征学习和提取能力,在知识库问答任务中取得了极为耀眼的成绩。然而,现有的基于深度学习的知识库问答依然遵循着实体检测和关系识别的步骤,但是此类方法忽略了知识库本身所蕴含的
论文部分内容阅读
知识库问答旨在通过解析用户的问句直接在知识库中提取出相应的答案,相比于传统的网页搜索可以极大提高用户的检索效率。传统知识库问答方法需要设计大量的规则和模板将用户的问句转化为结构化的表示,并不适用于大规模的知识库。深度学习凭借其强大的特征学习和提取能力,在知识库问答任务中取得了极为耀眼的成绩。然而,现有的基于深度学习的知识库问答依然遵循着实体检测和关系识别的步骤,但是此类方法忽略了知识库本身所蕴含的结构信息以及这两项任务之间的联系。本文致力于研究深度学习在知识库问答中的应用。针对现有知识库问答算法的缺陷和存在的问题,提出了两种基于深度学习的知识库问答方法及知识库问答系统的设计与实现。具体研究内容如下:(1)针对传统基于深度学习算法没有考虑知识库本身结构化信息方面的不足,提出了基于表示学习的知识库问答模型。在模型中首先应用知识表示模型将知识库中的实体与关系映射至低维的向量空间,然后通过神经网络将问句也嵌入相同的向量空间,并检测出问句中的实体,并在此向量空间内度量知识库三元组与问句的语义相似度。实验结果表明,该算法可以较大提升知识库问答的准确度,论证了知识库嵌入对于知识库问答任务的提升作用。(2)鉴于自然语言处理领域里程碑式的BERT模型在阅读理解、文本匹配等领域的卓越表现,提出将BERT模型应用至知识库问答。首先证明了BERT对于知识库问答各个子任务较为明显的提升作用,另外结合基于知识表示的问答任务的技术路线特点,对BERT模型的输入加以改造,将知识库问答的各个子任务融合进一个模型,并引入损失函数加权和迭代式训练的多任务训练策略进行训练。实验结果表明,可以通过对知识库问答的子任务进行组合训练来提高最终的问答准确率。(3)区别于传统网页检索系统,将知识库问答的检索过程及结果进行可视化,设计了知识库问答系统。首先将知识库导入图数据库,然后用前端开发框架Vue.js设计网页界面,并使用Flask对后台语言解析、图数据库调用等算法进行接口的封装。本文将上述两个知识库问答方法应用至Simple Question公开数据集上展开实验,通过多组对比实验来衡量模型的效果,并将实验结果与应用在对应公开数据集上的其他方法进行对比,结果表明本文提出的方法可以较大提升知识库问答的性能表现。另外本文设计的知识库问答系统也具有非常好的易用性和实用性。
其他文献
IGBT是电力电子技术中一种重要的功率半导体器件,高速绝缘栅极晶体管可以作为开关管应用在DC-DC开关电源系统中,DC-DC开关电源广泛应用于现代生产生活中,绝缘栅极晶体管的封装与其所在系统的封装对两者稳定可靠的工作具有重要的意义。基于上述研究背景,本文研究IGBT功率模块的封装,首先研究了IGBT半桥模块的封装,然后研究设计了基于高速IGBT的移相全桥变换器,并对该变换器进行系统级封装分析设计。
建筑工程实验室计量检定工作的有效实施直接影响着实验室检验数据的准确性,计量检定工作不到位,会给检测机构带来严重风险,甚至给客户造成损失。通过对建筑工程实验室设备检定工作中存在的问题进行分析,并提出改进措施。
文章介绍了“十三五”期间我国高校检验检测机构人员、设备、服务情况,总结了检验检测机构在人才培养、支撑学科建设、标准化建设、社会服务等方面取得的成绩,以及在抗击新冠肺炎疫情中做出的贡献,同时也指出在人员发展、应对复杂变局、风险意识等方面存在的不足,提出面对“十四五”发展新格局,应从服务创新、技术支撑、服务公信力和品牌等方面深化改革、提升竞争力,实现高质量发展。
随着媒体在冲突事件中的角色被关注,媒体与冲突的关系成为社会冲突研究的重要部分。本文借助议程设置理论,从冲突中媒体的议程设置功能、新媒体在冲突的议程设置过程中的运用和媒体对冲突的议程设置效果的影响三个方面,对媒体与冲突的关系进行了分析,并提炼出三个关键词:建构、弥合和延伸。本文认为,从议程设置的角度切入是对新媒体语境下媒体与冲突多元关系的一种统合,既可以反映政府对冲突进行"舆论引导"的过程和效果,也
短叶黄杉(Pseudotsuga brevifolia)隶属于松科黄杉属(Pseudotsuga),因其数量稀少而被列为国家二级保护植物,其在喀斯特山顶地段有良好的适应性,但因其树木材质优良,被砍伐破坏量大且生长缓慢,现呈零散分布。本研究调查了黔西南至广西河池地区与广西南部地区分布的两个短叶黄杉集群,通过划分龄级结构、编制静态生命表、绘制存活曲线与生存函数曲线,揭示短叶黄杉种群结构及动态特征,以探
肺癌是严重影响人类健康的全球性高发疾病,早期的诊断以及提高诊断的准确率可大大减小肺癌引起的死亡率。早期肺癌以肺结节的形式而存在,目前对肺结节的检测主要利用计算机断层扫描技术(Computed Tomography,CT)。如果所有的CT图像都由放射科医生手工筛查,那么这将是一个十分耗时的任务。因此,有必要开发能够定位、分割病灶区域的自动化方法。肺结节与周围组织外观相似,且不同患者的肺结节的位置、大