论文部分内容阅读
随着在线教育的发展,我国在线教育的课程规模和应用范围逐渐攀升至世界首位。在线课程在给人们带来方便快捷的学习方式的同时,也易因课程资源过多引发学习者产生认知迷航或课程选择困难等问题。利用个性化推荐方法,能够帮助学习者从海量的课程中自动挑选出适合其认知基础或学习兴趣的专属课程。现阶段课程推荐算法的应用仍然存在着数据稀疏、知识逻辑关系缺乏以及可解释性不足等问题。第一,数据稀疏问题。在线教育平台提供了海量的课程供庞大的学习群体进行选择,但由于学习者选择的课程数目较少,以至推荐模型可利用的交互行为数据十分稀疏,由此挖掘出的用户兴趣易出现偏差,降低推荐结果的准确度与稳定性。第二,知识逻辑关系缺乏。基于学习者兴趣的课程推荐未考虑不同课程在知识体系中的内在逻辑关系,存在推荐的课程难度停滞、无序等问题,难以使学习者按照课程之间的内在逻辑来进行学习路径规划。因此,在进行课程推荐时考虑课程之间的语义关系,在知识层面寻找用户的兴趣路径是必要且有意义的。第三,可解释性不足。在推荐场景中,给予恰当的推荐结果解释,可以提升用户的信任与接受度。当前主流的推荐方法多数通过训练拟合学习者与选课行为之间的函数关系,但由于求得的函数关系中参数和变量维度没有对应的具体实际含义,因此可解释性不足。针对以上问题,本文拟通过融合知识图谱技术与深度推荐模型充分挖掘数据稀疏情况下的学习者兴趣,采用知识图谱对课程进行语义层面建模,将课程集合对应到知识图谱当中,解决知识逻辑关系缺乏问题。通过基于知识图谱的线性特征挖掘,一方面利用知识图谱信息缓解数据稀疏问题,另一方将无法对应到具体影响因素的兴趣特征对应到知识图谱中的具体实体,从而使用实体和关系来直观的展示学习者的兴趣路径,提升推荐的可解释性。具体工作如下:(1)构建适用于在线课程推荐的课程知识图谱从大量的开放知识图谱数据中寻找适用于在线课程推荐的知识图谱数据源,结合从网络上爬取的课程名称及课程内容数据,通过实体链接、筛选等方法进行数据处理,采用自底向上抽取子图和知识图谱补全的方式构建适用于课程推荐的课程知识图谱。(2)基于知识图谱增强的推荐算法Ripple_mlp通过在模型层面有机融合知识图谱信息和深度协同过滤算法思想,提出了知识图谱增强的推荐算法Ripple_mlp。算法利用多层关系扩散的特征提取方法与深层感知机进行双网络学习训练,最后得到推荐概率。使用慕课网的真实数据进行实验表明,Ripple_mlp算法得到了比基准算法更高的推荐结果准确度,并提升了推荐结果的可解释性。(3)基于共现实体网络的知识图谱推荐算法Ripple_mlp+为了进一步提升模型的推荐准确度,我们针对课程推荐这种“课程名-实体集合”的“一对多”的特殊性质,在Ripple_mlp算法基础上引入共现实体网络Co-net,追溯捕捉用户的显性兴趣特征,以便能够更好的挖掘学习者兴趣。使用慕课网的真实数据进行实验表明,Ripple_mlp+算法在保证推荐结果具备可解释性的基础上,获得了最佳的推荐结果准确度。综上所述,本文采用实体链接等方法构建课程知识图谱用于推荐,刻画了课程推荐领域的语义网络关系,缓解了数据稀疏问题,补充了缺失的知识逻辑关系;提出知识图谱增强的推荐算法Ripple_mlp,提升了数据稀疏情况下推荐结果的准确性,同时解决了推荐缺乏可解释性的问题;提出基于共现实体网络的知识图谱推荐算法Ripple_mlp+捕捉用户显性兴趣,算法在保证推荐具备可解释性的基础上,进一步提升了数据稀疏情况下推荐结果的准确性。研究总体显著提升了课程推荐算法的推荐效果,奠定了课程推荐实际应用的基础。