基于聚类和模式挖掘的协同过滤算法研究与应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:jueduizhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和数据规模的日益扩大,为了让用户获取到更加符合自身条件的数据,推荐系统应运而生。协同过滤被普遍的运用在当前许多推荐系统中。协同过滤推荐存在数据稀疏性和系统的可扩展性问题。基于这两个问题,本文将聚类方法和模式挖掘技术应用到其中做出相关研究和改进。本文先研究梳理现有的推荐系统的分类,同时也总结这些推荐系统的优缺点。然后着重对协同过滤推荐系统的整个流程进行详述,并基于此总结不同类别的协同过滤算法的优缺点。结合这些研究提出如下改进:第一,为了缓解数据稀疏性的影响,本文提出一种结合频繁模式挖掘算法的评分填充方法MFM。该方法首先按照评分可以简化为高分和低分的特点将评分矩阵进行预处理,产生初始事务集后执行FP-Growth算法挖掘出频繁模式;然后处理这些频繁模式,产生能够衡量用户对项目评分高低的参照集合;最后使用这些参照集合计算出用户对项目评分为高分的概率,利用此概率值计算出填充评分。由于得出的填充评分更加合理,使得该方法能明显提升推荐质量。第二,本文基于聚类和标签改进协同过滤算法的近邻选择。首先结合信息熵计算用户对项目标签的偏好值,进而构造用户-项目标签偏好矩阵,在该矩阵上使用K-means算法完成用户聚类;与此同时使用用户标签对用户进行分类;最后将用户聚类与用户分类的结果合并,产生候选近邻集合用于近邻选择。通过这种改进使得近邻选择能在更小且更加精确的用户集合中进行,从而在保证了推荐质量的同时有效提升系统的可扩展性。第三,基于上述两个改进点提出本文改进的算法FPMUC-UCF。为了验证上述改进的有效性,本文基于Java语言和LibRec设计实验,并在MovieLens100K数据集上进行仿真实验得出实验结果。经过实验的对照证实本文提出的改进点的有效性。在上述理论研究和实验的基础上,本文最后使用改进的算法以Java Web技术和B/S架构实现了一个电影推荐系统MRSystem,同时详细的阐述系统各个部分的实现过程。在完成系统的开发后,达到了理论知识的实际应用。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探索健康教育对农村首发精神分裂症患者康复的影响.方法将符合入组标准的100例农村首发精神分裂症患者分为健康教育组和对照组(每组50例).两组均给予相仿的药物治疗,其中
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的研究Solitaire AB型支架在急性大脑中动脉闭塞动脉取栓术所具有的效果及安全性。方法选取2016年4月~2018年3月期间于本院接受急性大脑中动脉闭塞治疗的患者30例设为研究
<正>一个优秀的项目经理既可以代表企业的良好形象和精神面貌,又是业主、物业服务企业之间的润滑剂,对于促进企业自身建设和长远、可持续发展将起到举足轻重的作用。笔者认为
对《北山移文》的创作意图,从唐李善、吕向到清张云傲、梁章钜,近人王运熙、沈玉成、曹道衡等都撰文探求过。但是,因各自的视角不一,中间也不无偏漏,这个问题并没有得到更好
<正>建设国际金融中心必须保持宏观经济政策的一致性及经济发展措施的有效性,强化金融监管的有效性,不断完善相关基础设施2015年3月伦敦金融城公司发布的"全球金融中心指数"(
全省第一所老年远程大学在这里开讲,全省第一所民办老年大学在这里创办,全省第一所老年人“鹊桥会”在这里兴起,全国百城千名老人畅游新乡,新型文化养老模式在这里起航,全省率先实
报纸