基于知识图谱的教育领域知识问答系统的研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhaoshi88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能产业的发展,领域人才需求快速增长,越来越多的学生将从事人工智能相关岗位作为自己的职业目标。但高校对于人工智能领域的人才培养处于起步阶段,缺少从企业人才需求角度出发的教学环境与平台。同时在信息爆炸的网络时代,学生需要在多个平台检索和查询有关人工智能领域的技术知识和应用需求,但返回的信息过于冗杂,需要耗费大量的时间和人力从返回结果中梳理并概括出相关知识以及企业对于人才的招聘要求。此外,分散在多个平台的网络数据由于其异构的数据形式,加大了挖掘深层语义信息的难度,使得多源数据难以被整合和利用。知识图谱技术用于快速描述领域概念以及实体之间的关系,是解决多源异构数据整合及分析的方法之一,具有广泛的研究与应用价值。本文基于实体识别算法和词共现抽取算法构建了教育知识图谱,并以此搭建了知识问答系统,为学生提供基于自然语言交互的知识服务。本文研究的主要工作有:1.针对多源异构的数据问题,定义了连接企业用人需求与学术资源的实体模型,以领域概念关联各类实体。2.针对企业职位数据中各类实体具有定义边界以及文本特征不明确的情况,本文运用了一种融合卷积神经网络和双向长短期记忆网络的实体识别算法,实验结果表明该方法可以较好的识别出所需实体,提高了实体识别的准确率和召回率。3.针对职位实体众多难以直接描述从事某个领域所需要掌握的技能以及不同技能的掌握程度的问题,本文提出了一种基于多因素混合的词共现抽取算法,结合共现关系、程度词语义相似度、主观理解来挖掘隐含信息,提取出人工智能每个核心领域的企业综合招聘需求,并将其定义为职位能力模型,实验结果表明该方法提取出的内容对于学生制定求职学习计划、了解领域知识具有较好的指导和参考意义。本文根据上述算法构建了围绕人工智能核心领域的教育知识图谱,搭建了基于知识库的领域问答系统,可以实时用自然语言与学生进行对话,帮助学生快速掌握领域概况,同时可以依据企业对于人才的需求来制定学习目标和学习内容,降低信息搜索的成本,从而提高学习效率,加速成为人工智能领域的优秀人才,实现职业目标。
其他文献
目的:研究探讨肺炎支原体(Mp)与儿童支气管哮喘的关系。方法:选择2006~2009年小儿内科门诊及住院确诊为肺炎支原体感染诱发支气管哮喘患儿150例为研究组,并以同期80例非Mp感染
目的:结合临床实践经验,开展神经节苷脂治疗新生儿缺氧缺血性脑病临床对比研究。方法:采用对照研究方法,经患者知情同意,将其分为对照组(40例)与观察组(40例),2组患儿均住院
目的:建立散瘀止痛软膏的微生物限度检查方法,保证方法的科学性和检查结果的准确、可靠。方法:采用大肠埃希菌、金黄色葡萄球菌、枯草芽孢杆菌、白色念珠菌和黑曲霉等5种试验
《呼啸山庄》被认为是英国文学史上的一部巨著。它的作者艾米莉.勃朗特也因此而久负盛名。这部分的原因是因为艾米莉在创作中受到了英美文学中影响广泛的哥特传统的影响,借鉴
批判性语篇分析旨在透过表面的语言形式揭示语言、权力和意识形态之间的关系:包括意识形态对语篇生成过程的影响,语篇对意识形态的反作用,以及两者是如何源于社会结构和权力
为了研究箭筈豌豆在鲁东南地区的适应性,了解其是否适宜在本地区作为饲用作物种植,从而丰富本区域内家畜的饲料来源。以兰箭1号、兰箭2号、兰箭3号三个品种为试验材料,分析了
对一定数量词汇的掌握一般被认为是外语水平的一个重要要素,这对于外语教育工作者以及外语教育研究者而言,词汇学习始终是他们关注的一个焦点。但对于词汇学习策略,早期的国
本研究尝试运用规则空间模型对909名被试在HSK[中级]听力理解题目上的作答情况作出诊断性评价。我们基于文献整理以及5名有语言测试和对外汉语教学经验的教师的意见,最终确定
文章在分析了图书馆在数字化整合服务的现状的基础上,提出了进行数字化整合服务的基点以及发展对策。
目的:评价学校健康促进对上海市外来务工人员子女的健康知识和健康行为的干预效果。方法:选取上海市闵行区、松江区3所外来务工人员子女学校为干预学校,2所公办学校为对照学