面向企业运维的自动问答系统技术研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:qnmdmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业将客户在使用产品时反馈的问题以元数据(运维工单)形式保存。本文以华东某国有企业为例,对元数据进行抽取清洗,获取有效的FAQ集和与FAQ集匹配的答案,并针对企业运维面向专业领域具有相对封闭且数据量大的特点,应用Hadoop生态圈中组件对海量运维数据进行计算与分析,并重点研究改进问句相似度计算模型和问句预分类方法,构建面向运维专业领域的自动问答系统,以便运维知识重用,促使用户自助获得与业务系统相关的知识,提升企业运维服务质量。主要研究内容如下:第一,设计面向限定域自动问答框架,将传统流程改进为通过计算新问句与历史问句的相似度,对新问句进行预先分类,快速匹配历史问句,实现自动问答。第二,对文本进行面向限定域分词预处理时,因为专业领域的原因,出现未登录词无法识别导致分词效果不佳的情况,通过制作专业领域字典的方法来提升分词准确率。对问句进行分词、去停用词等预处理之后进行关键词扩展,并制作词权重表,提高问句相似度计算准确率。第三,通过对问句进行分析,从句法和语义两方面改进问句相似度计算模型,加入问句长度影响因子并考虑词序和语义对问句相似度计算的影响。同时基于新问句相似度计算模型改进问句分类计算方法,避免由于样本分布不均造成分类误差,并通过使用不同实验数据的实验验证上述问句模型和分类方法的有效性,分析问句预先分类对整体性能的影响。第四,针对企业运维系统产生数据量较大的实际情况,应用大数据生态圈中组件,使用本文设计的专业词典、问句相似度模型和分类方法,分析处理元数据,实现运维自助服务。
其他文献
浅议板书秦燕鸣板书是课堂教学内容的书面化和形象化,是教师向学生传授知识的重要手段,也是教师课堂教学中的基本功之一。在我国,学校教学活动大多数都采用以教师为主体的课堂教
随着桑园树龄的老龄化,桑园冬季管理显得更为重要。桑园冬季管理包括土壤管理和桑树管理两个方面,土壤管理包括冬耕除草、排灌施肥、绿肥种植等;桑树管理包括植缺株、整枝剪梢、
镁合金是当前制造工业中作为结构材料最轻的金属。它具有强度高、密度小、比模数高、易于切削加工和回收等优点,在航海、轨道交通、航空航天等领域应用中得到了普及。作为一种高性能新型结构材料,在实际应用中往往会遇到结构件之间的连接。搅拌摩擦连接是一种新型的固相连接方法。主要应用于低熔点金属及其合金的固态连接,打破了传统镁焊接的制约,避免了连接区疏松和热裂纹等缺陷。本文针对10mm厚AZ31B镁合金搅拌连接区
岩溶区的地下水和岩溶泉水是我国众多城市和工农业的重要供水水源.面对近年来普遍出现的泉水流量衰减、水质污染和无序开采等问题,以汾河流域8处岩溶大泉为研究对象,通过分析