论文部分内容阅读
我国是一个统一的多民族国家,历史文明的长河孕育出丰富多彩的民族节日。每个民族节日都具有其独特的文化价值,承载了各个民族的精神与情感,探索合适的数字化方式保护和传播优秀的民族节日文化至关重要。知识图谱是结构化的语义知识库,用于以符号形式描述现实世界中的概念及其关系。目前许多领域已对知识图谱构建与应用做了深入研究,但将知识图谱应用于民族文化建设,特别是民族节日文化领域的研究还处于初步探索阶段。因此,本文针对民族节日领域的特点,面向传播民族文化的任务,对民族节日知识图谱的构建与应用进行研究,主要包括如下四个方面:(1)面向非结构化文本的民族节日信息抽取方法研究。针对在非结构化文本中三元组提取任务,提出了基于ALBERT预训练语言模型的管道式三元组抽取模型对传统的关系抽取模型进行优化,在避免命名实体识别的误差向关系分类过程的传递的同时提高预测速度。该模型在自建的数据集上验证可较好地完成知识抽取任务。(2)民族节日知识图谱构建研究。首先从不同平台获取知识原始数据,提出改进的本体构建流程并构建初始的民族节日领域本体;然后依据本体约束将多源异构的数据使用针对性的知识抽取方法获取民族节日三元组,并提出基于流水线方式的知识融合方案去除冗余知识;最后将三元组使用Neo4j图数据库保存完成初始的民族节日知识图谱构建。(3)基于知识图谱的民族节日知识问答模型构建。提出融合深度学习与模板匹配的知识图谱问答模型,通过实体识别、意图识别、类型判断等语义分析方式,将自然语言问句转化为Cypher查询语句,并构建问句测试集验证转化的正确率。同时还对模型的问答回复细节进行优化,提高模型的人机交互体验。(4)民族节日文化资源知识服务平台设计与开发。基于以上工作设计并开发基于知识图谱的民族节日文化资源知识服务平台,该平台不仅可以提供命名实体识别、关系识别、三元组抽取等信息抽取技术支持,还可以提供知识图谱可视化检索、民族节日知识问答系统、知识图谱在线管理等应用。