论文部分内容阅读
自20世纪90年代初商业机构进入Internet起,商业应用的巨大需求不断推动Internet迅猛发展。Internet由于其互联性、易操作性以及随着技术进步带来的低费用、便捷性,已经成为人们获取信息的必要工具,并直接导致了人类社会从工业社会到信息社会的转型。但与此同时,信息爆炸时代的来临使人们每天面对海量的信息,并难以从中提取对自己有价值的部分,这使得信息的有效利用率极为低下。因而,针对用户特征和历史的个性化推荐称为当今的重要议题。协同过滤推荐技术是现存的推荐系统中最早应用且最为成功的技术之一,但是随着互联网技术的不断更新以及时代发展的需要,必须不断改进协同过滤算法,并在这过程中发现了其瓶颈,即冷启动问题和倾向推荐热门商品(不推荐长尾物品的)的问题。本文从用户浏览记录以及商品评论信息两处出发,结合传统协同过滤算法以及对商品评论的情感分析向用户进行商品推荐。具体完成了以下工作:首先,进行了对某电商平台的用户浏览记录以及商品评论信息的爬取;其次,使用传统协同过滤方法对用户对商品的倾向性值进行计算;再次,对商品评论进行情感分析,提取出商品的特征以及在该特征上的好评度,结合浏览历史综合考量,计算出一个用户对商品的倾向性值;最后,将两次得到的用户对商品的倾向性值加权,线性回归获取是推荐的准确率最高的最终的推荐列表最终结果表明推荐的准确率和冷门商品占比高于传统的协同过滤推荐算法。