基于用户聚类的个性化推荐算法在导购网站中的应用

来源 :江苏大学 | 被引量 : 1次 | 上传用户:wangchuabnao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
导购网站将大量优惠商品信息集中展示出来,为广大消费者的购买和商家的营销提供了很大的便利。现有的导购推荐系统为了解决评分矩阵的稀疏性问题,主要采用平均数、众数等默认值去填充评分矩阵,缺乏对导购网站个性化特点的利用,导致推荐准确率偏低。另外,现有的导购推荐系统为了加快在线计算速度,大都采用划分聚类算法对用户进行聚类,虽然划分聚类算法时间复杂度较低,但极易陷入局部最优解且对簇的形状不敏感,进而在邻居用户查找过程中引入错误的邻居用户,导致推荐准确率的下降。针对以上问题,提出了基于用户聚类的个性化导购推荐算法。在算法的矩阵填充和用户聚类过程中,分别提出了一种利用朴素贝叶斯算法进行矩阵填充的方法和一种改进的聚类算法。最后,在实现了各个功能模块的基础上进行了系统的性能测试。论文主要工作如下:(1)导购推荐系统的需求分析与功能设计。分析了导购推荐系统的需求,设计了数据收集模块、行为量化模块、个性化推荐模块和热门推荐模块等主要功能模块。数据收集模块用于收集商品属性,并利用Ajax技术收集用户行为数据,为个性化推荐提供数据基础;行为量化模块将用户的各种行为按照相应权重加权求和,量化成评分,为相似度计算和用户聚类提供条件;个性化推荐模块采用了论文提出的基于用户聚类的个性化导购推荐算法进行个性化推荐;热门推荐模块将近期销量较高的商品推荐给用户。(2)基于用户聚类的个性化导购推荐算法。提出了一个包含商品类别筛选、矩阵填充、用户聚类和生成推荐等步骤的完整的个性化推荐算法。在矩阵填充过程中,针对平均数、众数等默认值填充方法导致推荐准确率低的问题,提出了一种利用朴素贝叶斯算法进行矩阵填充的方法。用商品属性作为朴素贝叶斯的特征,将多级评分预测转化成多元分类,初步预测出未操作商品的评分,填入稀疏的评分矩阵;在用户聚类过程中,针对划分算法容易陷入局部最优解和对簇的形状不敏感的问题,提出了一种基于密度划分准则的二分K均值算法。利用二分K均值算法以缓解局部最优问题,在划分前利用DBSCAN算法找出子簇最多的簇,将该簇作为二分K均值算法中进一步划分的簇,以解决划分算法对簇的形状不敏感的问题。(3)导购推荐系统的实现与性能测试。基于Java和Mahout实现了各个功能模块。分别进行了聚类和推荐的性能测试,实验表明,基于密度划分准则的二分K均值算法比已有聚类算法在聚类纯度上有所提高,基于用户聚类的个性化导购推荐算法相比已有推荐算法在平均绝对误差上降低了约12%,在准确率和召回率上各提升了约5%。
其他文献
针对慈利烟叶生产多年来的发展情况,从理论和实际上阐述了烟叶产业化发展的基本现状、制约因素及加快烟叶产业化发展的对策。
植物物候模型是基于植物对环境因子的响应机理而建立的可模拟植物生长发育的数学方程.本文介绍了树木物候模型和作物物候模型,根据对植物休眠解除过程的不同理解,树木物候模
由于家庭、社会、个体的综合作用,当代学生具有个性鲜明、性格突出的特点,学生个体差异化明显。国家建设需要大批创新人才,这就要求在基础教育教学中,教师应面向全体学生,遵循因材施教、以人为本和分类指导的教学原则。本文基于分层教学理论对初中物理合作教学进行实践研究。首先用SPSS软件对八年级学生第一次月考物理成绩进行差异性的分析;对八年级第一学期学生物理学习情况和教师对于分层合作学习的认识以及支持情况进行
【案情】 1995年6月28日,原告与二被告签订《典当契约》。契约规定,信德公司将桑塔纳轿车一辆质押给承典人典当行,当金10万元;当期一个月,典当服务费率为每月2.5%;由典当行在
闽政办[2017]147号各设区市人民政府、平潭综合实验区管委会,省直有关单位:为贯彻落实国务院《关于建立粮食安全省长责任制的若干意见》(国发[2014]69号)精神,根据《中华人民
目的:基于高通量测序技术探讨微小RNA(miRNA)在窦性心律(Sinus Rhythm,SR)及心房颤动(Atrial fibrillation,AF)患者血浆外泌体中的表达差异,寻找可能和房颤发生发展密切相关
【目的】采用实时RT-PCR检测手足口病肠道病毒,了解2009年合肥地区手足口病的病原学特征,为手足口病防治工作提供科学依据。【方法】采集2009年1月—12月期间合肥地区328例手
跟着科技的飞速发展,对于炼钢出产率、钢材成本、钢材纯度和使用性能都提出了越来越高的要求。提高钢水质量的有效途径是通过精炼钢水来调整钢水的成分,其主要设备是钢包精炼
农业氨减排是雾霾治理最经济有效的方法,而农田肥料施用造成的氨排放是农业氨排放的重要部分。本研究旨在探讨冬小麦-夏玉米复种体系下土壤氨排放对秸秆还田的响应,为减少农业氨排放和控制雾霾提供理论依据。本试验于2018年6月—2019年6月在陕西关中杨凌地区,对土壤氨排放、0~40 cm土壤无机氮以及产量进行了测定分析。试验采用双因素裂区设计,主区为秸秆还田方式,设不还田(S0)、半量还田(S0.5)和全
随着对外汉语的蓬勃发展,越来越多的研究者开始关注对外汉字教学,相关文章也层出不穷,“汉语热”的现象也愈演愈烈。菲律宾作为中国的邻国之一,在地理和人文上都有着其他国无