论文部分内容阅读
随着近些年互联网的高速发展,人们在享受着大数据便利的同时也面临着信息爆炸带来的困扰,传统搜索引擎已无法满足人们快速准确获取信息的需求,而智能问答系统的出现能很好的解决这一问题。在游戏服务领域,截止到2018年全国游戏用户规模达6.26亿人,游戏产业收入2144.4亿元,占全球市场收入的23.6%。如此大规模的用户在进行游戏时会遇到各种各样的问题,目前只能论坛、贴吧、浏览器等地方,通过关键词查找的方式,查询到按照时间顺序排列的网页和帖子,内容繁多复杂,几乎找不到满意的答案。针对上述问题,本文构建的基于深度学习的游戏语料智能问答系统,可以接受用户的自然语言输入,经过信息检索与问答匹配后返回游戏用户一段精准的答案,极大的提升了用户的游戏体验,对增加游戏活跃度和降低运营商成本有很大帮助,因此有很大的市场发展空间和应用价值。本文主要研究内容如下所示:(1)在限定领域目前没有公开的数据集,本文通过领域网站、知乎问答平台和搜狗问问问答平台多途径收集游戏知识问答语料,通过编写爬虫程序获取游戏问答语料。之后经过数据清洗去除不必要的噪音后存入数据库中,完成限定领域语料知识库的建立。(2)在信息检索部分,本文首先对循环神经网络RNN、双向长短时记忆网络BLSTM(Bi-directional Long Short Term Memory)、混合网络BLSTM/CNN以及融入了注意力机制的BLSTM/CNN混合神经网络进行原理和结构上的分析,并通过实验证明融入注意力机制的BLSTM/CNN混合神经网络在信息检索方面的优越性,并最终提高了问答系统的准确率。信息检索的具体过程为系统接受到用户发送的文本,然后输入我们的融入注意力机制的BLSTM/CNN混合模型,经过信息检索和余弦相似度计算输出最终结果。(3)本文设计并实现基于上述混合模型的游戏语料智能问答系统。系统深度学习算法采用Python语言和谷歌的TensorFlow深度学习框架,系统后台选择Spring Boot轻量级框架,数据持久层采用MySQL数据库,数据访问层使用企业级的MyBatis框架。用户通过web界面提交问题,系统后台接收到自然语言文本后,通过在游戏语料知识库中的检索和匹配返回给用户相应答案,最终将结果展示在web页面。本文不仅对提出的融入注意力机制的混合模型进行了验证,并利用此模型完成了游戏语料智能问答系统的构建。