论文部分内容阅读
随着互联网技术的快速发展,网络教育为学习者的个性化学习、终身学习提供了有利条件。但是随着网络教育平台的建设发展,课程种类不断丰富、数量大幅度增加,信息过载问题日益突出,学习者短时间内无法从大量课程中选择出适合自己的课程。此外,现阶段的网络教育平台中多具搜索、分类等功能,在课程方面存在适应性和个性化不足的问题。如何根据学习者需求和历史行为数据快速定位其感兴趣的课程是个性化学习的诉求,也是网络教育平台建设需要考虑的重要问题。本研究以干部网络教育培训平台为例,针对传统基于内容的推荐算法在建模时语义分析不足的问题,引入自然语言处理领域的Word2Vec模型,并提出基于Word2Vec和TF-IDF的课程推荐算法,以提高课程推荐的准确度,通过干部网络教育培训平台的数据验证算法有效性,并将其应用于平台的课程推荐中。研究的具体工作可以总结如下:首先,基于Word2Vec和TF-IDF的课程推荐算法研究。研究对国内外教育资源推荐现状进行梳理,针对推荐系统中常见的推荐算法及原理进行分析,设计基于Word2Vec和TF-IDF的课程推荐算法,它综合了词向量的语义分析优势以及词频统计的重要性。课程推荐的实现模块主要有基于Word2Vec的词向量表示、词向量聚类、特征向量表示和相似度计算等。其次,对课程推荐算法进行实验和测试。首先,研究将平台中获取的原始数据集进行标准化处理,共有网络课程1539门,学员数量240124名。其次,将课程数据作为语料进行实验,实现文本预处理、训练词向量、聚类、相似度计算等过程,从而得到课程推荐列表。最后,为测试算法的推荐效果,研究设计离线实验进行测试,测试方案主要有两方面。其一,设计24组对比实验测试不同聚类方法(自适应聚类、K-mean聚类、Birch聚类)的推荐效果,确定最优方案。其二,测试了不同算法(均值Word2Vec、TF-IDF、Word2Vec和TF-IDF)的推荐准确度,验证算法有效性。最后,设计和实现课程推荐系统。研究从需求出发,设计系统的功能结构、数据库E-R图和数据表结构并完成系统开发。由于研究以干部网络教育培训平台为例进行算法实验和测试,以此为基础建设的课程推荐系统不仅是对算法结果的呈现,解决了学习者课程选择困难的问题,也是对平台推荐服务不足的补充。