论文部分内容阅读
现代远程网络教育的兴起与发展,使得教学资源数字化、网络化,信息资源膨胀化。现代远程教育作为新兴的一种教育模式,网络教育平台应该以学生求学的网络化服务为设计的出发点和最终目的,既要能够满足学生的一般学习需求又要能够针对学生的专业的类型、需求特征等信息来确定网络教育平台的资源和服务内容,从而实现向智能化知识网络方向发展。个性化推荐系统是解决这一问题的途径之一。推荐系统是在信息过滤技术的基础上衍生的技术。信息过滤技术能够较好的解决“信息过载”和“资源迷向”问题,让人们能更充分的使用Internet资源。信息过滤技术是实现信息资源个性化推荐的基础。基于信息过滤技术的推荐系统具有良好的发展和应用前景。目前几乎所有的大型商务系统都使用了不同形式的推荐系统。但是,在现代远程教育教学网络平台中推荐系统的使用还是凤毛麟角。本文以山东师范大学远程网络教育教学平台的建设为基础,提出了基于内容聚类的协同过滤推荐算法。在深入地研究了推荐系统所依赖的相关技术的基础上,对各种技术进行了分析和探讨,将个性化的推荐系统引入到远程教育网络平台中,设计并实现了一个为学生提供定制学习资源和学习项目的个性化推荐系统。本文的主要做了如下几个方面的工作:1、对现有推荐系统的相关技术进行深入研究探讨了推荐系统的关键技术,重点研究了基于协同过滤的推荐算法和基于内容过滤的推荐算法,并指出这两种推荐算法的优缺点。针对其优缺点找到使之较好结合的方法和系统实现方式。2、在着重研究协同过滤算法的基础上提出基于最近邻聚类的协同过滤算法基于最近邻的协同过滤算法考虑和强调的是最近点的重要性,因而忽视了整体用户间的相似性,而且如果训练样本太大则算法的计算量就很大,因此,该算法不适用于分类速度较高的文本分类。本文针对其缺点提出了基于最近邻聚类的系统过滤算法,该算法错误率较低,很大程度上减少分类量,从而在一定程度上加快了分类速度。3、提出基于内容的蚁群聚类协同过滤推荐算法由于基于最近聚类的协同过滤算法本身的局限性即只能保证搜索到目标项的大部分邻居,但并不能保证搜索到目标项的所有最近邻居,所以可能会降低推荐系统的推荐精度。因此本文在着重研究基于蚁群聚类算法的基础上提出了基于内容聚类的协同过滤推荐算法,该算法是将改进的蚁群组合聚类算法和协同过滤相融合,从而克服了单一使用内容聚类和协同过滤推荐算法的缺点。改进的蚁群组合聚类算法的优点是不用输入初始聚类中心和聚类中心间的最小距离等参数,避免了聚类算法对初始聚类中心等参数的敏感性和参数设置不当会影响聚类结果等问题,并通过实验详细的讨论和分析该算法。4、基于内容聚类的协同过滤推荐算法应用在远程教育平台中本文设计并实现了一个为学生提供定制学习资源的个性化推荐系统。采用改进的蚁群组合聚类算法同协同过滤技术相结合,通过挖掘学生定制学习信息资源的事务数据库得到学生定制内容的组合模式,即用户兴趣模型,对学生进行定制推荐提供个性化服务。系统可以根据学生的兴趣和目的不断变化将学生的访问活动实时捕获,再动态的将该学生划分到某一类兴趣模式,因而生成不同的推荐结果。本系统可以将数据库的更新及时的反应在学生所保存的推荐结果中,同时本系统通过对学生的访问历史进行统计为专业教师和系统管理员指引资源收集的方向。5、设计并实现了具有个性化推荐功能的远程教育网络平台本文就一个实例演示了推荐系统在远程教育网络平台中的应用效果,并详细介绍了山东师范大学网络教育教学平台的个性化推荐系统的设计和实现过程。最后,提出了对本推荐系统的改进意见,对推荐系统在远程教育平台中的发展作了展望。