基于商品评论和销售数据分析的推荐方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:neilakw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的不断发展,商务网站上的商品数量和种类与日俱增,个性化推荐系统可以帮助用户快速的从海量的商品中挑选出满足自己需求的商品。而常用的协同过滤算法存在着数据稀疏性和冷启动等问题进而影响了协同过滤算法的准确性。而商品评论中有大量的消费者对商品及其属性的观点和情感,蕴含了重要的消费者偏好信息;历史销售数据能够直观的反映出消费者的购买行为和偏好,通过对销售数据和评论数据中用户偏好有效的提取并应用于个性化推荐中,可以提高推荐算法的准确性。
  本文在对国内外相关文献进行综述的基础上,结合销售数据关联规则分析结果和商品评论文本的情感分析结果,提出了基于用户消费偏好的改进协同过滤推荐算法和基于用户购买模式商品推荐算法。首先,考虑用户复购性低等特征,对销售数据进行用户类群的划分,通过对不同用户类群购买商品特征元素的关联规则分析,挖掘了不同用户类群的不同消费偏好和购买模式规则。其次,分析了商品评论文本的特征,发现商品评论语句中不包含情感词但有情感倾向,或者有情感词但没有情感倾向等隐性情感的评论文本较为常见,传统的分析方法均忽略具有该特点的语句,基于上述特点提出了基于隐马尔可夫模型的隐性情感分析方法,不提取情感词,将情感倾向分类问题转化为隐马尔可夫的输出序列的概率计算问题,对商品评论信息进行了细粒度的情感分析,并依据用户在商品属性上的具体情感得分,结合用户评论的关注度指标精准定义了用户消费偏好模型。接着,提出了基于用户消费偏好模型的改进协同过滤推荐算法,基于用户消费偏好模型,定义了用户相似性计算方法,考虑冗余过滤和时间及商品的用户情感得分等因素,生成推荐列表,为目标用户推荐最优商品。针对新用户问题设计了基于用户购买模式推荐算法,根据用户购买模式,提出基于用户类群的商品特征和用户特征的推荐策略,为目标用户推荐符合其偏好的商品。
  最终,本文以“苏州贝宝电子商务有限公司”的真实数据为样本进行了实验,对销售数据进行关联规则分析,对评论文本进行商品特征提取、情感分析和偏好模型构建,并实施两种推荐算法并进行算法验证。与传统的推荐算法对比,本文提出的个性化推荐算法可以对用户产生更准确的推荐,在电子商务网站中有一定的应用前景和潜力。
其他文献
电子商务的快速发展深刻改变着我国农产品的商业生态,“互联网+农业”模式的吸引力越来越大,传统农产品行业的商业经营者面对着新的发展大趋势开始尝试“互联网+农业”模式。 2018年2月4日,中央一号文件更是指出要开展农超对接、农社对接,帮助农户对接市场,支持电商、物流、金融与农业结合,加快转变农业发展方式,农产品电子商务成为大众话题中的热点。  本文在生鲜农产品平台快速发展的背景下,针对生鲜农产品高损
新产品的开发对于企业提升市场竞争力具有非常重要的作用,而对于新产品的概念选型是企业研发过程中的关键环节。在实际市场环境中的新产品概念选型问题,一方面要考虑新产品的创新质量或技术基础,另一方面也要考虑企业决策者对于未来新产品的评价信息、指标的期望信息以及指标的相关权重信息。专利作为创新活动的产物,在很多时候能够作为企业新产品开发的技术基础和概念选型来源,因此,利用专利作为技术基础或知识来源进行新产品
众包竞赛作为一种新兴的社会互动行为下的商业模式,在研发、创意、广告等活动中得到广泛的应用。创意众包通过互联网平台,以众包竞赛的模式来汇集公众的创意思维、创意知识、创新技能和信息等,使得企业直接面对消费者,更有效地开拓创新产品设计,应对市场快速变化的需求。众包竞赛不仅能够充分发挥社会闲散人员的力量,还能够满足企业创新的需求,为企业创新提供一种新的模式。通过这种商业模式可以使企业获得更加广泛的智力资源
学位
自2008年美国次级房贷危机以来,金融市场的系统性风险愈演愈烈,引起了世界范围内的关注。银行间拆借市场凭借其资金融通的便利作用,在金融体系中的地位愈发重要,但同时也成为金融系统性风险发生的重要传播渠道。近年来,网络科学理论逐步成为银行系统性风险领域新的研究方向。目前,国内外学者大多是基于多种外生网络对风险传染进行研究,即事先人为地设定银行节点间的拆借关系,但这种静态网络结构并不能反映真实的银行网络
学位
经济的飞速发展带动越来越多人们生活水平的不断提高,人民对于产品质量水平也是越来越敏感。所以,此时再单纯的依靠低层次的价格战已经不能在激烈的市场竞争中取得胜利,而如何以合适的价格向消费者提供高质量的产品成为企业的必然选择。目前供应链管理的思想引起越来越多企业和学者的关注,供应链质量管理也是目前企业和学者所研究的重点问题。  长此以来,供应链管理的方法和模型研究都是建立在“经济人”假设的基础上,这个假
学位
由于存在计划提前期,服装零售销售预测与实际市场需求不一致是常态,同时服装商品存在季节性和价值易逝性的特征,动态打折销售是服装零售企业进行库存控制,优化运营收益的一个常用工具。因此,从商家角度,基于不断变化的市场需求,进行动态价格折扣调整,以达到有限销售期内的收益最大化,是新零售时期服装零售企业运营管理的一个重要课题。新零售环境下,服装零售实现了线上线下数据整合,积累了大量的历史销售数据,为服装零售
学位
近几年,伴随着共享经济而来的电动汽车分时租赁业务,因其租车的便利性与能源的清洁性,正在逐渐壮大之中。城市共享电动汽车租赁公司,在积极运营租赁业务的同时,需要面临共享电动汽车的清洁问题,以便提供更好的服务获得更高的满意度。本文研究了城市共享电动汽车清洁排程优化问题,即电动汽车需要在有限的时间窗内进行清洁服务,其中每辆电动汽车都有多个可被清洁的时间窗并对应地点信息。论文的主要工作与创新点:  (1)通
本文从经典报童模型出发,研究两个变量(成本与需求、价格与需求)随机且具有相关性的情况。其中关于随机变量的处理,考虑到历史数据稀缺,无法获得准确的分布,而只能得到分布的矩模糊集的特点,本文采用分布式鲁棒优化方法对随机变量进行处理,并采用条件风险价值(Conditional Value at Risk,CVaR)度量决策者的风险态度,基于以上说明,建立了分布式鲁棒方法下基于矩确定和矩不确定模糊集的建模
学位
近年来,数次金融危机对各国乃至全球经济造成了巨大冲击,金融危机的爆发与金融系统内在结构的脆弱性密不可分。因此,研究金融系统内在结构特征,进ー步提升系统稳定性成为国内外关注的重点。而银行在我国金融系统中是重要组成部分之一,从研究银行系统稳定性相关问题出发,了解银行系统构成的网络结构特征及相关参数变化的作用,对于进ー步抓住金融系统内在脆弱性根本原因,维护整个金融系统稳定性有着较强的理论与现实意义。  
学位
商业信用不仅是基于商品而非资金为载体的间接融资服务,也是一种有效的激励协调合同。在供应链的环境中,制造商为下游零售商提供商业信用合同,允许零售商提前付款或延期付款。对于零售商而言,他们可以释放资金占用并鼓励其增加订货量;同时,对于制造商而言,他们也获得了更多的产品批发收益。但在商业信用的实际运作过程中,主要存在以下的结构性问题。第一,组成供应链的每个节点企业由于承担了不同的角色往往会有各自的信息优
学位