基于神经网络技术的智能问答系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:stenvenxin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能时代,以关键词搜索的方式获取信息存在着很多的局限性,已经不能满足互联网用户获取信息的需求。例如,用户搜索不到真正需要的信息,返回的无关信息太多,或者用户需要的信息未排列在前几位结果中。能够接受用户以自然语言的形式提问,并能从大量的数据中查找或推断出用户问题答案的问答系统就成为了当前学者们的研究热点。问答系统按照问题的领域可以分为开放领域和限定领域的问答系统,根据答案的生成方式可以分为检索式和生成式的问答系统。本团队与西安交通大学口腔医院修复科合作设计一套基于神经网络技术的智能问答系统,最终本文设计的问答系统属于基于检索式的兼顾开放领域和限定领域的问答系统,系统中涉及的限定领域就是口腔修复领域。也就是说本文设计的问答系统既能够回答开放领域的问题,类似于聊天机器人,又能够回答限定领域(口腔修复)的问题,同时还能回答一些患者常问问题(就医流程,就医环境等)。本文的主要的研究内容包括语义相似度计算方法,问题分类方法,口腔修复领域问题语义分析等,主要的贡献如下:1.对于语义相似度计算,本文设计了两种方法,第一种是使用Siamese网络架构去做语义相似度计算。对于Siamese网络架构中的网络A和网络B,我们使用的是Bi-LSTM与Attention机制相结合的网络结构,然后使用曼哈顿距离计算两个文本向量之间的距离。第二种是基于当下比较流行的预训练方法去做语义相似度计算。本文选择刷新11项自然语言处理任务记录的预训练模型BERT来完成这个任务。针对本文的数据集,本文对这两种方法做了详细的实验对比,选择了一个性能较优的方法。2.对于问题分类,本文设计了三种方法。第一种是采用带有高斯核函数的非线性支持向量机对问题进行分类,以数据的TF-IDF值作为特征。第二种是采用Bi-LSTM与Attention机制相结合的神经网络分类模型对问题进行分类。第三种是基于预训练方法去完成问题分类任务,本文选择的预训练模型依然是BERT。针对本文的数据集,本文对三种方法做了详细的实验对比,最终选择了一个各项指标都较优的方法。3.对于口腔修复领域问题语义分析,本文对问题进行分词、词性标注、依存句法分析等步骤。然后本文经过对大量的用户问题进行实验,本文制定了一套依存关系过滤规则,在系统的实际运行中取得了非常好的效果。本文在最后对所设计的问答系统的各个模块以及整个系统做了详细的测试,测试结果显示本文所设计的问答系统完全达到了上线运行的标准。本文所设计的问答系统已经在西安交通大学口腔医院修复科公众号中投入使用,并且得到了用户的一致好评。
其他文献
陆面是大气重要的下垫面,对气候有十分重要的影响。作为陆面过程在气候模式中的唯一体现,陆面模式的性能对气候模式也尤为重要。干旱区范围广大,不同下垫面陆面过程差异十分
全球定位系统(GPS)能在全球范围内为无限多的海陆空用户提供精确的实时位置、速度和时间信息,其在现代局部战争中表现出的巨大效能,使得对GPS信号的有效干扰已成为当务之急。
从时间与空间的维度来看,乡村都是以城市限定自身。许多研究乡村问题的著作和期刊,既是从城市和工业现实中建立的范畴和语码对乡村文化进行分析阐释,又是为着城市与工业社会
全球气候日趋转暖从上世纪七十年代初露端倪。社会公众、科学界和各国政府已经开始着重思考全球环境问题。顺应世界气候变化,中国的气候也呈现转暖趋势。根据IPCC的报告可以
随着能源危机和环境污染问题日益严重,以分布式光伏发电为代表的新能源发电技术得到广泛关注。在提高供电可靠性、保护环境的同时,配电网中电力电子器件使用规模不断增大,开关频率不断升高,电网呈现宽频域、超高次的新型谐波特性,给电网电能质量带来不小的挑战。尤其是以往超高次谐波引起的电能质量问题并不突出,未能引起足够的重视,国内相关的研究也处于起步阶段。因此研究分布式光伏并网谐波特性具有重要意义。本文主要研究
一种以嵌入银行信用的应收账款集合作为基础资产的证券化产品较好地满足了中小企业的应收账款融资需求,受到了市场的广泛认可。但是,对于以不同方式嵌入银行信用的应收账款是
随着电网的发展,对最优潮流研究的要求也不断提高。为了更好地帮助电力系统提高安全性能、增强经济效益以及提供优质的电能,需要不断改进最优潮流算法,解决当前复杂电网优化
书写幼儿学期评语是幼儿园教育评价工作中的主要方式之一,同时也是幼儿教师专业水平和实践能力的重要组成部分。它不但可以体现出教师教学和幼儿在园学习与发展过程中存在的问题,而且还能发映出幼儿学期评语书写者所持有的儿童观、教育观以及评价观,对幼儿和教师都有着教学中其他环节无法替代的重要意义。但从理论和实践层面上来看,幼儿学期评语的研究与探索未能得到重视。理论成果不多,实践积累的一些零碎经验也是由在职幼儿教
片式多层陶瓷电容器(MLCC)作为基础电子元器件,除在智能手机等民用产品中使用外,在航空航天等军用领域均具有普遍的应用。其性能主要受介质材料的上限工作温度影响,因此,本文首先以宽温温度稳定型介质材料为研究目标,借助现代微观测试手段及电学测试方法,探究不同掺杂剂对钛酸钡介质材料中极化过程的影响机制,提高钛酸钡基介质材料的上限工作温度;另外,为满足MLCC的低成本化需求,实现介质材料的抗还原性能成为关
目前,治疗癌症的疫苗需要简单而且行之有效的配方,用来增强体液和细胞免疫应答。纳米技术在疫苗研发过程中受到了越来越多的重视。因为纳米粒子(NPs)广泛的选择范围,为纳米粒