论文部分内容阅读
随着国家教育体系的日益完善,越来越多的人可以进入高校接受高等教育。但在众多的高校中,人们以何种方式从大量无序的信息资源中有效地查看各高校相关信息,如何根据自身兴趣选择一所高校,这些问题都会阻碍人们进行科学客观的决策。目前很多领域都借助知识图谱开展了相关的应用研究,在教育领域中构建高校信息知识图谱,以帮助人们高效获取知识颇为重要。使用知识图谱可视化技术,以网络图的形式表达知识,更好地展示出了高校基本信息。但随着节点规模和关系的增加,也会加重知识图谱可视化的视觉负担。因此,本文构建高校信息知识图谱,并设计知识图谱可视化模型,搭建可视化平台进行实验对比,为解决获取知识难度大、可视化效果差等问题提供了研究思路。具体研究工作如下:
(1)构建高校信息语料库。借助爬虫技术,从网络资源中爬取真实的高校基本信息和各行政区基本信息,对数据进行整理后存储至数据库中。
(2)构建高校信息知识图谱。结合高校信息的特点构建高校信息本体,根据行政区信息的特点构建其对应的本体。依靠构建好的本体从语料库中抽取知识三元组,用不同的方法对结构化、半结构化和非结构化数据进行知识抽取。最后把知识三元组存储至图数据库中。
(3)知识图谱可视化模型的构建。以构建好的高校信息知识图谱作为基础,从降低图元结构复杂度和用户交互两个方面进行分析,详细设计用户兴趣模型、关键词搜索模型和用户交互模型,有效解决知识图谱可视化中存在的视觉混乱等问题。
(4)搭建交互式知识图谱可视化平台。根据各功能要求和划分好的功能模块,制定相对应的系统框架,使用现有可实现的技术,严格遵守各个模块的实现流程,以完成可视化平台的开发。从各可视化平台功能性的层面进行对比,总结当前工作存在的不足之处和可取之处。
根据可视化模型的方案以可视化平台进行展示。该模型能有效缓解知识图谱可视化的视觉负担,能够以清晰的图网络展示各高校的相关信息,辅助用户结合自身兴趣进行决策。
(1)构建高校信息语料库。借助爬虫技术,从网络资源中爬取真实的高校基本信息和各行政区基本信息,对数据进行整理后存储至数据库中。
(2)构建高校信息知识图谱。结合高校信息的特点构建高校信息本体,根据行政区信息的特点构建其对应的本体。依靠构建好的本体从语料库中抽取知识三元组,用不同的方法对结构化、半结构化和非结构化数据进行知识抽取。最后把知识三元组存储至图数据库中。
(3)知识图谱可视化模型的构建。以构建好的高校信息知识图谱作为基础,从降低图元结构复杂度和用户交互两个方面进行分析,详细设计用户兴趣模型、关键词搜索模型和用户交互模型,有效解决知识图谱可视化中存在的视觉混乱等问题。
(4)搭建交互式知识图谱可视化平台。根据各功能要求和划分好的功能模块,制定相对应的系统框架,使用现有可实现的技术,严格遵守各个模块的实现流程,以完成可视化平台的开发。从各可视化平台功能性的层面进行对比,总结当前工作存在的不足之处和可取之处。
根据可视化模型的方案以可视化平台进行展示。该模型能有效缓解知识图谱可视化的视觉负担,能够以清晰的图网络展示各高校的相关信息,辅助用户结合自身兴趣进行决策。