论文部分内容阅读
随着人工智能产业的发展,领域人才需求快速增长,越来越多的学生将从事人工智能相关岗位作为自己的职业目标。但高校对于人工智能领域的人才培养处于起步阶段,缺少从企业人才需求角度出发的教学环境与平台。同时在信息爆炸的网络时代,学生需要在多个平台检索和查询有关人工智能领域的技术知识和应用需求,但返回的信息过于冗杂,需要耗费大量的时间和人力从返回结果中梳理并概括出相关知识以及企业对于人才的招聘要求。此外,分散在多个平台的网络数据由于其异构的数据形式,加大了挖掘深层语义信息的难度,使得多源数据难以被整合和利用。知识图谱技术用于快速描述领域概念以及实体之间的关系,是解决多源异构数据整合及分析的方法之一,具有广泛的研究与应用价值。本文基于实体识别算法和词共现抽取算法构建了教育知识图谱,并以此搭建了知识问答系统,为学生提供基于自然语言交互的知识服务。本文研究的主要工作有:1.针对多源异构的数据问题,定义了连接企业用人需求与学术资源的实体模型,以领域概念关联各类实体。2.针对企业职位数据中各类实体具有定义边界以及文本特征不明确的情况,本文运用了一种融合卷积神经网络和双向长短期记忆网络的实体识别算法,实验结果表明该方法可以较好的识别出所需实体,提高了实体识别的准确率和召回率。3.针对职位实体众多难以直接描述从事某个领域所需要掌握的技能以及不同技能的掌握程度的问题,本文提出了一种基于多因素混合的词共现抽取算法,结合共现关系、程度词语义相似度、主观理解来挖掘隐含信息,提取出人工智能每个核心领域的企业综合招聘需求,并将其定义为职位能力模型,实验结果表明该方法提取出的内容对于学生制定求职学习计划、了解领域知识具有较好的指导和参考意义。本文根据上述算法构建了围绕人工智能核心领域的教育知识图谱,搭建了基于知识库的领域问答系统,可以实时用自然语言与学生进行对话,帮助学生快速掌握领域概况,同时可以依据企业对于人才的需求来制定学习目标和学习内容,降低信息搜索的成本,从而提高学习效率,加速成为人工智能领域的优秀人才,实现职业目标。