论文部分内容阅读
各领域网上服务业务都蓬勃发展,其中教育信息化越来越受到人们的重视。学习者面对庞大复杂的线上教育资源无从下手,针对不同用户的不同需求进行个性化的推荐系统应运而生,不但使学习者的效率得到显著的提升,而且对教育信息化线上推广也起到了积极作用。通过深入调研发现,目前一些在线教育企业并未使用推荐系统,而是通过关联规则匹配最合适的资源推荐给用户。经过不断修改的关联规则本身冗长复杂难于维护,以至于规则有可能会前后冲突,这些都无从解释。本文基于上述背景探讨了教育信息化的必要性;研读和借鉴了国内外学者针对在线教育资源推荐提出的优秀方案;深入学习了相关的推荐算法。针对协同过滤推荐算法存在的冷启动和数据稀疏性两大难题,本文结合在线教育场景在传统协同过滤算法的基础上提出了改进,使其在该场景下推荐效果得到显著提升。论文的主要工作有以下几个方面:第一,本文选择Pearson相关系数作为相似性计算模型,针对用户——项目评分矩阵稀疏导致推荐质量下降的问题,提出一种时间衰减函数以及共同评分项数加权的改进方法。其基本思想是:首先定义时间衰减函数,如果两个用户对同一物品作出评价的时间间隔越小,则用户之间的相似度就越高;其次,将用户之间共同评分项数占所有评分总数的权重融入到相似度的计算,突出共同评分数目多的用户在计算相似度时作出的贡献。第二,在改进的Pearson系数计算模型的基础上提出了融合用户特征寻找最近邻居集的方法,解决用户冷启动问题。合理设计动态调和参数将用户特征属性相似性与Pearson系数相似度有效组合。当新用户进入系统时,完全依靠用户本身基本信息评估用户间相似性,这是一个比较合理的解决方案。第三,结合某在线教育公司真实的数据集,将修正后的混合协同过滤推荐算法与传统算法设计对比实验。验证了本文算法通过混合Pearson系数模型和用户特征调整用户间的相似度,一方面在一定程度上缓解了新学生进入系统的冷启动问题;另一方面提高了数据稀疏时推荐系统的可信度。经过修正的混合协同过滤推荐算法在个性化教育资源推荐的场景相比传统算法有更有效更高质量的推荐。基于本文提出的混合协同过滤推荐算法,设计实现了在线教育推荐系统。这是一个动态的系统,实时的接受新的用户评分并产生推荐,当用户行为信息更充分时,推荐结果会更收敛。