论文部分内容阅读
随着互联网技术的迅猛发展,电子商务平台和以大众点评网为代表的第三方点评网站的出现为用户提供了表达商品使用意见的网络平台,用户的评价和评分记录为其他用户进行商品选择提供了参考。基于这种大量的用户产生数据,传统的商业问题,如商铺类型的选择和商铺档次的确定,有了新的定量分析和解决方法。商铺类型(例如,餐饮店,时装店等)及商铺档次选择对于投资者而言一直都是极具挑战的问题,传统的解决方式是通过问卷调查和基于经验的评估,这些方法由于缺少与商铺相关的具体数据,在实施过程中耗时耗力且不具有可扩展性和延续性。随着社交媒体和基于位置的网络服务的普及,大量的用户产生数据为商铺推荐的研究提供了丰富的信息,包括个人消费历史、基础的商铺信息、地理信息等。本文通过采集网络媒体中用户的评论数据和商铺数据以及基于位置的网络服务中的地理数据,对影响商铺受欢迎度的因素进行分析。在此基础上,本文对商铺类型和商铺档次的推荐问题进行研究。论文的主要工作如下: 1.利用基于位置的服务网站百度LBS开放平台提供的API获取基本的地理数据,通过爬虫程序抓取第三方点评网站大众点评中的商铺数据,将异构的商铺数据和地理数据进行融合,并对数据集进行分析,探索影响商铺受欢迎度的相关因素,作为商业推荐研究的基础。 2.为解决商铺类型推荐问题,本文提出了商铺类型推荐的系统框架,并通过预测商铺在给定类型下的受欢迎度进行商铺类型推荐。论文将影响商铺受欢迎度的因素分为两类:地理相关的因素(如到商业区中心的距离、交通便利性、商铺多样性和人流密度等)和商业相关的因素(如竞争性和互补性等)。在对影响商铺受欢迎因素分析的基础上,本文提出了基于特征融合和偏好学习的矩阵分解算法,解决商铺类型推荐问题。最后,通过与其他算法进行对比,验证了算法的可行性和有效性。 3.从投资者角度出发,对于新开商铺,在确定了商铺类型之后,需要进一步选择合适的商铺档次。本文在商铺类型推荐问题的基础上,提取与档次相关的特征,通过预测已知类型的商铺在给定档次下的受欢迎度进行商铺档次推荐。本文提出了结合商铺最近邻的张量分解方法解决商铺档次推荐问题。实验结果表明,所提出的算法由于在计算商铺的邻居商铺的基础上对三阶张量进行了初始化而取得了较好的预测结果。