论文部分内容阅读
大规模开放在线课程(MOOC)通过互联网技术将优质的教学资源在线开放,使得广大学习者有机会访问和学习,逐渐形成了新的教学模式。在近十年的发展中,MOOC市场规模持续上涨,且由于新冠疫情的影响,MOOC俨然成为了不可或缺的教学手段。随着MOOC平台上课程资源和学习者规模的不断上涨,单一的互动与反馈方式已经不足以覆盖大规模、多样化的受众群体,智能化MOOC教学模式的研究与应用势在必行。在智能化MOOC教学模式中,基于人工智能技术的导学系统被嵌入到MOOC平台,旨在综合MOOC平台中的课程资源为多样化的学习者提供个性化的学习策略建议。然而,由于缺少体系化个性化的用户画像建设、知识概念级别的课程资源管理以及可解释的个性化学习路径推荐等,MOOC智能导学系统尚未形成具有可行性的解决方案。针对上述问题,本文聚焦面向MOOC的个性化学习路径推荐关键问题,从用户画像、知识概念图谱和学习路径推荐三个方面出发展开探索性研究。第一,针对MOOC用户画像体系设计与实现任务,本文综合教育领域中学习者建模的既有研究,探索性地提出了覆盖静态画像、动态画像和观点画像的多方位MOOC用户画像体系,并针对现有研究的缺失或不足展开实践研究。具体地,在MOOC学习者的人格特质静态画像方面,本文针对现有文本驱动的人格分析研究通常忽略细粒度语义信息以及缺乏对时间维度信息利用等问题,提出了基于文本多视图特征的人格分析模型;在MOOC学习者的能力追踪动态画像方面,本文受到认知诊断与知识追踪的启发,结合MOOC场景弱交互的特点,提出了面向课程主题的学习者能力追踪模型;在MOOC学习者的评教情感观点画像方面,本文针对MOOC场景中的评教文本数据特性,融合连续语义单元信息,提出了认知过程启发的连续语义单元文本情感分析方法。在以上三类画像构建研究中,本文均通过构建真实数据集对所提方法进行了实验验证。第二,针对MOOC知识概念图谱构建任务,本文对大规模语料数据和小规模语料数据两种情况展开研究,分别提出了相应的图谱构建解决方案。具体地,本文从通用知识图谱构建问题出发,关注目前联合抽取技术中的信息损失、误差传播以及忽略实体和语义关系间联系三个挑战性问题,提出了基于立体空间视角的联合抽取模型,多个基准数据集上的实验结果表明该模型提升了知识图谱构建精度。在进一步的研究中,本文聚焦MOOC小规模语料场景,对该场景中文本语料少、知识概念频率低、知识概念间存在覆盖等问题,提出了两阶段MOOC知识概念识别方法,通过提取候选知识概念集合后构建分类模型的方法识别课程包含的知识概念。进而,本文从语言、位置、学习记录等方面提取多源特征并构建分类模型对知识概念间的层次关系、先序关系进行预测。通过构建真实数据集对知识概念识别和知识关系提取方法的性能进行评估,最终形成了MOOC知识概念图谱构建的解决方案。第三,在MOOC学习路径推荐任务上,本文从融合用户画像和知识概念图谱两个角度进行探索,依次提出了融合用户画像、融合知识概念图谱以及同时融合两者信息的MOOC学习路径推荐方法,实现推荐准确性和可解释性的同时提升。在具体的研究中,一方面,本文从用户画像角度提出能力追踪增强的MOOC课程推荐方法,将学习者认知能力评价信息引入推荐模型,在提升推荐准确性的同时,从认知能力增长的角度为推荐结果提供可解释性;另一方面,本文从知识概念图谱角度提出知识概念路径增强的MOOC课程序列推荐模型,引入元路径规则从知识概念图谱中抽取有效的知识概念路径辅助推荐任务,在提升课程推荐准确性的同时,根据元路径描述的学习者选课过程为推荐结果提供可解释性。最终,本文提出“能力监督+知识增强”的MOOC课程序列推荐模型,在知识概念路径增强的序列推荐模型中引入能力追踪信息,通过构建真实MOOC课程推荐数据集进行实验验证,形成了统一的融合用户画像和知识概念图谱的MOOC个性化学习路径推荐解决方案。