基于深度学习的智能问答模型研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:kissall79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检索口语化文本或专业领域用语时,传统的搜索引擎已不能满足实际需求,随着深度学习技术的广泛应用,智能化的问答更能适应不同应用领域。智能问答是通过对文本深度语义信息的理解,在问题库中检索匹配度较高的知识信息,并将答复语句进行反馈的过程。面对现有的智能问答模型中存在的不足,本文在命名实体识别,文本分类和文本匹配任务上进行改进,从而提高智能问答结果的准确率。具体研究内容如下:首先,针对现有命名实体模型在面对复杂实体词汇边界划分不清的问题,本文提出了基于深度学习的命名实体模型,其融合了基于WoBert模型的词汇增强算法,使模型能够引入外部词汇信息,增强模型对词汇特征的理解,从而有效划分实体词汇边界和实体类别。在公开数据集上进行实验,选用由精确率、召回率的调和平均值F1作为模型评判指标,结果表明本模型F1值达到82.19%,比Bert-CRF模型效果提高了 7%。其次,面对复杂长文本语句时,基于深度学习的单层神经网络较难理解文本真实语义信息,因此本文提出基于自注意力机制多特征提取融合网络模型,其通过自注意力机制来理解文本语句在上下文结构中的依赖特征,使用深度卷积注意力叠加网络和基于注意力机制的双向门控组合网络分别对文本语义进行深度挖掘,然后将提取到的两种语义特征拼接为融合特征表示向量,通过使用Softmax分类器实现对文本特征的类别划分。经过在公开数据集上的对比实验,结果表明该模型F1值比CNN模型提高了 11.6%。然后,针对现有文本匹配模型效果不佳的问题,提出使用多层多特征提取融合的文本匹配模型。将文本匹配模型分为两层,一层为基于孪生Bert模型多特征提取融合的文本匹配模型,另一层为多特征融合的相似度算法。实现对问答库文本的层层筛选,深入理解文本真实语义,从而提升文本匹配效果。在公开数据集上对文本匹配模型进行实验测试,本文模型F1值高达70.75%,对多特征融合的相似度算法实验测试,结果表明多特征融合的文本相似度计算更加符合用户需求。最后,将智能问答模型应用于寻医问药智能问答系统中,实现与用户的真实信息交互,能够有效地理解专业领域知识,经过多组测试,得出问答准确率达到74%,从而验证了本文模型的可行性和有效性。
其他文献
低照度图像增强是一种通过增强图像整体或局部区域对比度来提高图像质量的重要技术,它能有效改善图像的视觉效果。然而,目前低照度图像增强技术在进行图像增强时仍存在三个问题:一是图像增强技术在增强复杂光照条件下的非均匀照度图像时,会出现过度增强和增强不足的问题,二是低照度图像的暗区域中存在噪声,图像增强技术在提高对比度的同时会放大噪声,三是图像增强技术在处理低信噪比图像时不能较好的处理同为高频的细节信息和
本文根据特殊项目背景,依据实物保护系统的安防要求,在某型一体化安防监控系统的基础上,实现了人员通信定位与物资状态定位的软硬件系统,开发了基于人员的实时通信定位和物资状态定位的室内定位系统,研究了基于BP神经网络的指纹定位算法。主要包括以下内容:(1)针对安防区域内的人员监管,采用ESP32物联网模块研制了 WiFi无线定位以及双向通信的人员可穿戴标签,提出了一种双重防脱摘机制结合的方式,通过采集心
煤炭是我国的主要能源,占中国矿物能源资源的95%。据统计数据显示目前我国在煤炭生产过程发生的重大事故中,由于矿井突水所引起的人员伤亡及财产损失始终位于各种矿井灾害的前面,因此在矿山的防治水工作中,对矿井水源的识别是工作的基础,在矿山防治水工作中起着不容忽视的作用,通过对水源判别的方法研究,建立起矿井水源的识别模型,并迅速准确地确定矿井水源来源,是解决问题的关键。针对上述问题,论文选择了水化学分析方
传统协同过滤算法无论在特征提取还是相似度计算方面仍存在数据稀疏和大量噪声数据等难题,从而使得推荐效率不高且用户满意度低。深度学习技术可以有效解决传统推荐算法存在的诸多问题,将深度学习技术应用到推荐领域已经成为当下研究的热门课题之一。针对传统协同过滤算法存在的特征提取复杂和数据维度高且稀疏等问题进行研究,对深度学习中的自编码器神经网络进行优化,主要使用MovieLens公开电影影评数据集作为推荐系统
因砂质黄土特殊的结构性、水敏性,浅埋偏压砂质黄土隧道软弱结构面多,不易成拱、受力不均匀,导致隧道围岩自稳能力差。隧道初期支护及二次衬砌受力不均匀,施工过程中易造成隧道地表大面积沉降和开裂,对隧道安全稳定性产生重要影响。开展大断面浅埋偏压黄土隧道稳定性分析,进行开挖工法优化研究具有理论价值和实践工程意义。以银西高铁惠安堡浅埋偏压砂质黄土隧道为研究背景,进行了砂质黄土的物理力学特性的室内试验,运用模型
当今安防技术迅猛发展,市场对安防的需求越来越高,传统的安防技术需要技术进步以适应社会的需求,安防需要向集成、数字、专业等方向发展。基于多传感器数据融合技术的一体化安防系统能从多个维度更精确和全面地获取被测对象的数据信息,提高系统报警准确率。因此,将基于多传感器数据融合技术运用于一体化安防系统具有重要的意义。本文主要研究内容如下:(1)为了解决ID3算法中存在的多值偏向问题,提出了一种基于改进ID3
现阶段我国煤炭地下长壁开采中,各综采工作面之间主要通过留设煤柱隔离采动影响,以达到保护采准巷道的目的。在采面面间煤柱设计中,如何设计出安全可靠、经济合理的煤柱显得尤为重要。为了研究采面面间煤柱稳定性,并给出合理煤柱留设宽度的设计方法,本文采用现场监测、理论推导、数值模拟的方法,对综采工作面面间煤柱所受荷载情况、煤柱支承压力与塑性破坏区分布情况进行研究,并将研究结果应用于玉华煤矿的采面面间煤柱设计中
煤炭能源是我国的主体能源,在维持国民经济稳健发展上具有重要作用。在煤矿的生产过程中,深部开采趋势增加使得工作面上更容易产生矿压灾害,对安全生产产生影响,给煤矿工人的生命安全带来了严重的威胁。绝大多数矿压灾害发生在来压期间,因此,预测工作面周期来压对预防矿压灾害、提供支护指导具有重要的意义。论文对工作面周期来压预测方法主要的研究内容如下:提出了基于Adamax-GRU的工作面周期来压预测方法。对矿压
为推动洁净煤技术在煤炭行业的发展,煤矸石分拣成为提升煤质的重要手段,而煤矸石目标检测是煤矸石分拣的关键,该步骤的定位与类别能够为后续分拣设备提供动作信息。当前煤矸石检测方法较为成熟的是射线识别,但射线危害环境的同时,难以通过单维度结果对煤矸石目标定位;图像检测法由于其绿色、安全等特性,已成为该领域的研究热点,但现阶段煤矸石图像检测均采用表征学习的分类方法,将此类问题看作机器学习中的分类任务,存在识
高光谱影像分类是遥感图像处理领域的研究热点之一,其对于土地覆盖类型研究、环境检测等领域有重要意义。传统的监督式分类方法往往囿于有标记样本少且难获取的问题,亟需新方法的开发与应用。半监督协同学习通过分类器互相提供高置信度的“伪标记”样本加入到训练样本集中,将对有标记样本的需求降到最小,在高光谱分类中有较高的应用价值。然而传统的协同学习算法往往存在初始分类器易受噪声数据的影响以及分类器互相挑选样本产生