论文部分内容阅读
互联网的迅速发展促进了教育领域的信息化改革进程,通过各类学习平台,学习者能轻易访问丰富的数字资源,但“知识迷航”的现象也愈发普遍,不仅用户无法定位所需知识内容,平台往往也缺乏充分整合和利用教育大数据的手段。相比搜索引擎的检索能力,辅助问答系统是提高知识获取精准度的有力方法。本文针对在线学习的常见场景,从解决知识检索和增强学习者交互体验的角度出发,结合自然语言处理的基本模型,提出面向在线学习的辅助问答模型,并基于该模型设计和实现对应的问答系统,论文的主要工作如下:(1)分析在线学习场景的知识问答类型,通过网络数据和开放语料库抽取教育领域相关的问答对,使用分词、词嵌入等多种自然语言处理技术,从中识别出实体和关系形成三元组,并利用实体对齐和消歧的方法融合多来源的知识资源,构建出以RDF为表示方式的知识库。(2)分别对知识查询和引导学习者进行教学任务两种应用场景,设计模型结构和训练方案,验证其有效性。对于面向知识查询的问答模型,采取基于seq2seq结构的浅层神经网络,并综合语义解析和搜索排序的结果来返回答案。对于面向教学任务的问答模型,则采用规则主导的有限状态机,人工定义用例与边界限制,为更多的应用场景提供可扩展、适用性强的范例。(3)根据已有模型和策略,基于模型嵌入和迭代,以及高并发的考量,设计并实现完整的面向在线学习的辅助问答系统的整体架构以及前端、后端、数据库的各部分细节,完成知识查询、教学任务引导、知识库管理等功能模块,最后对系统进行功能与性能上的测试,检验其稳定性。