论文部分内容阅读
随着电子商务的飞速发展,通过网络购物的消费者越来越广泛。众多的电子商务平台在为消费者提供更多的商品选择的同时,也在一定程度上增加了消费者快速挑选出满意商品的困难性。比价类网站通过网络爬虫从各个电商平台抓取最新商品信息,可以为用户集中展示不同电商网站同一商品的价格对比信息,为用户选择更加优惠的电商平台提供了参考。但是,比价网的商品展示模式多为被动的展示,即系统仅按用户搜索关键词显示相关商品信息,没有主动向用户推荐商品。本文结合协同过滤推荐算法,在比价网上增加商品推荐系统,实现比价网由被动展示模式向可进行个性化推荐的主动展示模式的转变。针对传统协同过滤算法无法及时适应用户兴趣变化的问题,本文提出用户兴趣时间性的概念,并结合信息熵对用户相似度计算方法进行改进,提出基于信息熵和用户兴趣时间性的协同过滤算法(IEICFA)作为推荐系统的核心算法。在爬取各电商网站商品信息时,为解决通用网络爬虫无法满足不同电商平台商品爬取需求的限制,本文针对电商平台的结构差异,对主要电商网站分别定制了不同的爬取策略,实现了自定义的网络爬虫,以完成对商品信息的采集工作,为系统的比价和推荐功能提供原始商品数据。本文最后设计并实现了基于网络爬虫的电商比价及推荐原型系统,可向用户提供注册登录、搜索比价、商品推荐和评分评价等功能。实现的自定义网络爬虫可适应网站的结构特征,完成对商品数据进行采集。提出的IEICFA推荐算法能够适应用户兴趣随时间变化的特性,可以有效提高推荐的精确度。