论文部分内容阅读
【摘要】:随着信息技术和商业信息化的不断发展,在电子商务的基础上发展出来了O2O模式,用户对于提供消费的商家提出更高的要求,用户希望自己享受个性化服务,商家能根据以往消费记录来推荐用户所需要的个性化信息,而数据挖掘技术能为用户个性化需求提供支持平台。以此为目标,本论文在用户需求的基础上,以数据挖掘技术和个性化需求服务为切入点,应用协同过滤算法,对该问题展开研究。
【关键词】:电子商务;协同过滤;个性化推荐
一 引言
随着计算机网络迅速发展,人们的购物方式也产生了变化,电子商务对传统的交易方式产生了重大的冲击,用户在网上购物的需求日益扩大,为了服务客户,电子商务开始向“以客户为中心的商业模式“进行转变,为了方便客户在海量信息中快速找到自己所需要的信息,对客户提供个性化服务成为了必要,在这个背景下,电子商务个性化推荐系统就产生了,它可以根据各人的浏览购买记录,提取各人喜好,从中分析出具有相似口味的用户或相似物品,从而对用户进行商品推荐。帮助用户更快,更好的找到自己所需要的东西,从而为每个用户提供个性化的服务
二,基于协同过滤的个性化推荐过程
现在个性化服务系统使用较多的技术有协同过滤技术,基于内容推荐,基于知识推荐等,协同过滤技术是目前研究最多,应用最广的个性化推荐技术。
协同过滤技术与传统的基于内容过滤直接分析内容推荐不同,它根据用户历史浏览或购买信息,协同过滤分析用户兴趣,综合相关信息对指定用户的信息喜好进行预测。
实现协同过滤技术,需要进行以下三个步骤:
一,收集数据,收集用户的历史行为数据,给接下来使用的推荐算法提供材料。
二,计算相识度,选择合适的计算相似度算法,如:
欧几里德距离,计算欧几里德空间中两个点的距离,距离越小,相识度越大。
皮尔逊相关系数,计算两个定距变量间联系的紧密程度,取值在[-1,1]之间。
等等方法
三,进行相似度计算后,我们可以进行协同过滤来进行推荐物品,协同过滤技术分为两种主流方法,基于用户的协同过滤技术和基于物品的协同过滤技术,基于用户的协同过滤是通过对用户的历史记录的研究,根据用户对物品的偏好,发现相似度较高的邻居,将邻居感兴趣的东西推荐给用户。基于物品的协同过滤技术是指在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。
在大部分的电子商务站点中,用户既想找到与购买的物品相似度较高的东西,也乐于参考别人购买的信息,两种方式各有各的优点和用途。基于以上,我认为电子商务网站应该70%进行基于物品的协同过滤推荐,30%进行基于用户的协同过滤推荐。
三,推荐系统整体框架设计
3.1用户特征
在用户访问系统时,推荐系统需要给每个用户生成相对应的特征,再根据相对应的特征来进行资源挑选,比如用户喜欢的物品是一种用户特征,和用户相似的人是一种用户特征,通过这些特征最终为用户生成推荐列表,整个过程大致可分为两部分,一是为用户定义特征,二是根据特征为用户推荐相对应的资源
由于是电子商务购买,特征可分为以下几类:
用户行为特征:包括用户的浏览和购买记录,并且可以从时间上分为近期和远期行为,优先近期行为。
用户特征标签:包括用户自己选择特征标签和从历史行为中提取出特征标签,将一个特征标签内的用户尚未浏览的商品推荐给用户。
综上所述,我们可以采用多个推荐引擎组合推荐,每个推荐引擎負责一类特征,根据权重进行计算。
3.2特征向量的形成
特征向量形成有两种,一种是用户直接填写选择,如自己选择自己的标签类型,另一种是根据用户的行为历史记录进行处理,形成自身的标签。
形成自己的标签类型主要由历史行为和行为的权重组成,如我们要从历史记录中提取用户的行为特征,我们参考的行为主要是物品种类,购买和浏览记录,在这些记录中,购买记录比浏览记录更能反映一个人的购物倾向,则购买记录的权重远远大于浏览记录,近期记录权重大于远期记录等。
通过提取的特征(如这个物品是浏览还是购买,购买时间等),加上设定的特征相关权重,进行计算后,我们可以得到初始的物品推荐表。
3.3过滤模块设计
在推荐列表中,有一些情况是需要过滤的
比如推荐列表中有客户已经购买或浏览过的商品
去除已经购买或浏览过的商品可以提高用户选择的效率,不做无谓的推荐
某些评价很糟糕的商品
商品评价糟糕,从一方面来讲,是不值得推荐的商品,推荐这种商品会拉低用户对网站的评价。
3.4排名模块
可以将推荐的资源进行分类,将每不同类别,不同筛选方式中排名较高的资源组合起来,形成新的推荐列表,有利于推荐列表多样性。
四,基于物品的协同过滤
4.1基于物品协同过滤算法
基于物品的协同过滤是指,通过用户历史记录,发现喜欢A物品的用户往往喜欢B物品,若一个用户购买A物品而从未浏览过B物品,此时,系统将会把B物品推荐给用户。
根据以上思想,我们可以计算物品相似度。
I为喜欢A物品的用户数,j为喜欢B物品的用户数,M(i,j)是同时喜欢A,B物品的用户,W(i,j)=M(i,j)/(i+j),W(i,j)越大,則A和B相似度越高。
首先建立一个总矩阵C,每个用户建立自己的兴趣矩阵,如用户1喜欢A,C,D物品,用户2喜欢A,B,D,则建立矩阵并汇总到总矩阵C:
将C矩阵归一化可得相似矩阵W,得到相似矩阵w后,用如下公式计算用户u对物品j的兴趣
其中,是用户U对j物品的兴趣,是用户购买或浏览过的物品,是和j相似的k个物品。是指i和j的相似度,是指用户对i的兴趣度。这个公式的意思是,在通过和物品j和物品j有相似关联且在用户历史记录存在的物品i之间的计算,总相似度越高,则越可能或者较高排名。
4.2基于用户的协同过滤推荐
若用户A需要推荐,可以找到与用户A相似的用户,用户B,将用户B喜欢的而用户A没有浏览过的物品推荐给用户A
建立总矩阵c,一行或一列表示一个用户,用户之间两两计算,总共有A,B,C,D物品,如用户A喜欢A,B物品,用户B喜欢A,C,D物品,用户C喜欢B,C,D物品,得到A,B喜欢相同物品为1个,A,C喜欢相同物品为1个,B,C喜欢相同物品为2个,则总矩阵C如下图所示:
A B C
A 1 1
B 1 2
C 1 2
将C矩阵归一化得到用户之间的相似矩阵W
得到相似矩阵W后,可以用如下基于用户的协同过滤算法进行计算
是和用户u相似的k个用户,是指对i感兴趣的用户,是指用户u和用户V之间相似度,是指用户v对i兴趣度,这个公式的意思是,在通过和物品i和對物品i感兴趣的和用户u较相似的用户u之间的计算,得到相似度越高,則越可能或者较高排名。
五 结束语
本文围绕如何将数据挖掘技术应用到电子商务个性化系统中,开展以下几方面研究,分析和研究个性化系统的工作原理的相关理论,对个性化推荐系统做了系统介绍;研究总结个性化推荐系统整体架构设计,用户特征向量形成,对过滤模块和排名模块设计并对其进行分析;研究个性化推荐系统中物品推荐模块,基于物品的协同过滤和用户的协同过滤给用户推荐感兴趣的资源。随着网络高速发展,推荐系统将会获得越来越普遍的应用,基于协同过滤的推荐算法使商务资源得到更加合理的应用。
基金项目:本项目得到西南民族大学中央高校基本科研业务费专项资金项目优秀学生培养工程项目的支持,项目名称:数据挖掘技术在个性化电子商务中的应用研究,项目编号:2016ZYXS19。
【关键词】:电子商务;协同过滤;个性化推荐
一 引言
随着计算机网络迅速发展,人们的购物方式也产生了变化,电子商务对传统的交易方式产生了重大的冲击,用户在网上购物的需求日益扩大,为了服务客户,电子商务开始向“以客户为中心的商业模式“进行转变,为了方便客户在海量信息中快速找到自己所需要的信息,对客户提供个性化服务成为了必要,在这个背景下,电子商务个性化推荐系统就产生了,它可以根据各人的浏览购买记录,提取各人喜好,从中分析出具有相似口味的用户或相似物品,从而对用户进行商品推荐。帮助用户更快,更好的找到自己所需要的东西,从而为每个用户提供个性化的服务
二,基于协同过滤的个性化推荐过程
现在个性化服务系统使用较多的技术有协同过滤技术,基于内容推荐,基于知识推荐等,协同过滤技术是目前研究最多,应用最广的个性化推荐技术。
协同过滤技术与传统的基于内容过滤直接分析内容推荐不同,它根据用户历史浏览或购买信息,协同过滤分析用户兴趣,综合相关信息对指定用户的信息喜好进行预测。
实现协同过滤技术,需要进行以下三个步骤:
一,收集数据,收集用户的历史行为数据,给接下来使用的推荐算法提供材料。
二,计算相识度,选择合适的计算相似度算法,如:
欧几里德距离,计算欧几里德空间中两个点的距离,距离越小,相识度越大。
皮尔逊相关系数,计算两个定距变量间联系的紧密程度,取值在[-1,1]之间。
等等方法
三,进行相似度计算后,我们可以进行协同过滤来进行推荐物品,协同过滤技术分为两种主流方法,基于用户的协同过滤技术和基于物品的协同过滤技术,基于用户的协同过滤是通过对用户的历史记录的研究,根据用户对物品的偏好,发现相似度较高的邻居,将邻居感兴趣的东西推荐给用户。基于物品的协同过滤技术是指在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。
在大部分的电子商务站点中,用户既想找到与购买的物品相似度较高的东西,也乐于参考别人购买的信息,两种方式各有各的优点和用途。基于以上,我认为电子商务网站应该70%进行基于物品的协同过滤推荐,30%进行基于用户的协同过滤推荐。
三,推荐系统整体框架设计
3.1用户特征
在用户访问系统时,推荐系统需要给每个用户生成相对应的特征,再根据相对应的特征来进行资源挑选,比如用户喜欢的物品是一种用户特征,和用户相似的人是一种用户特征,通过这些特征最终为用户生成推荐列表,整个过程大致可分为两部分,一是为用户定义特征,二是根据特征为用户推荐相对应的资源
由于是电子商务购买,特征可分为以下几类:
用户行为特征:包括用户的浏览和购买记录,并且可以从时间上分为近期和远期行为,优先近期行为。
用户特征标签:包括用户自己选择特征标签和从历史行为中提取出特征标签,将一个特征标签内的用户尚未浏览的商品推荐给用户。
综上所述,我们可以采用多个推荐引擎组合推荐,每个推荐引擎負责一类特征,根据权重进行计算。
3.2特征向量的形成
特征向量形成有两种,一种是用户直接填写选择,如自己选择自己的标签类型,另一种是根据用户的行为历史记录进行处理,形成自身的标签。
形成自己的标签类型主要由历史行为和行为的权重组成,如我们要从历史记录中提取用户的行为特征,我们参考的行为主要是物品种类,购买和浏览记录,在这些记录中,购买记录比浏览记录更能反映一个人的购物倾向,则购买记录的权重远远大于浏览记录,近期记录权重大于远期记录等。
通过提取的特征(如这个物品是浏览还是购买,购买时间等),加上设定的特征相关权重,进行计算后,我们可以得到初始的物品推荐表。
3.3过滤模块设计
在推荐列表中,有一些情况是需要过滤的
比如推荐列表中有客户已经购买或浏览过的商品
去除已经购买或浏览过的商品可以提高用户选择的效率,不做无谓的推荐
某些评价很糟糕的商品
商品评价糟糕,从一方面来讲,是不值得推荐的商品,推荐这种商品会拉低用户对网站的评价。
3.4排名模块
可以将推荐的资源进行分类,将每不同类别,不同筛选方式中排名较高的资源组合起来,形成新的推荐列表,有利于推荐列表多样性。
四,基于物品的协同过滤
4.1基于物品协同过滤算法
基于物品的协同过滤是指,通过用户历史记录,发现喜欢A物品的用户往往喜欢B物品,若一个用户购买A物品而从未浏览过B物品,此时,系统将会把B物品推荐给用户。
根据以上思想,我们可以计算物品相似度。
I为喜欢A物品的用户数,j为喜欢B物品的用户数,M(i,j)是同时喜欢A,B物品的用户,W(i,j)=M(i,j)/(i+j),W(i,j)越大,則A和B相似度越高。
首先建立一个总矩阵C,每个用户建立自己的兴趣矩阵,如用户1喜欢A,C,D物品,用户2喜欢A,B,D,则建立矩阵并汇总到总矩阵C:
将C矩阵归一化可得相似矩阵W,得到相似矩阵w后,用如下公式计算用户u对物品j的兴趣
其中,是用户U对j物品的兴趣,是用户购买或浏览过的物品,是和j相似的k个物品。是指i和j的相似度,是指用户对i的兴趣度。这个公式的意思是,在通过和物品j和物品j有相似关联且在用户历史记录存在的物品i之间的计算,总相似度越高,则越可能或者较高排名。
4.2基于用户的协同过滤推荐
若用户A需要推荐,可以找到与用户A相似的用户,用户B,将用户B喜欢的而用户A没有浏览过的物品推荐给用户A
建立总矩阵c,一行或一列表示一个用户,用户之间两两计算,总共有A,B,C,D物品,如用户A喜欢A,B物品,用户B喜欢A,C,D物品,用户C喜欢B,C,D物品,得到A,B喜欢相同物品为1个,A,C喜欢相同物品为1个,B,C喜欢相同物品为2个,则总矩阵C如下图所示:
A B C
A 1 1
B 1 2
C 1 2
将C矩阵归一化得到用户之间的相似矩阵W
得到相似矩阵W后,可以用如下基于用户的协同过滤算法进行计算
是和用户u相似的k个用户,是指对i感兴趣的用户,是指用户u和用户V之间相似度,是指用户v对i兴趣度,这个公式的意思是,在通过和物品i和對物品i感兴趣的和用户u较相似的用户u之间的计算,得到相似度越高,則越可能或者较高排名。
五 结束语
本文围绕如何将数据挖掘技术应用到电子商务个性化系统中,开展以下几方面研究,分析和研究个性化系统的工作原理的相关理论,对个性化推荐系统做了系统介绍;研究总结个性化推荐系统整体架构设计,用户特征向量形成,对过滤模块和排名模块设计并对其进行分析;研究个性化推荐系统中物品推荐模块,基于物品的协同过滤和用户的协同过滤给用户推荐感兴趣的资源。随着网络高速发展,推荐系统将会获得越来越普遍的应用,基于协同过滤的推荐算法使商务资源得到更加合理的应用。
基金项目:本项目得到西南民族大学中央高校基本科研业务费专项资金项目优秀学生培养工程项目的支持,项目名称:数据挖掘技术在个性化电子商务中的应用研究,项目编号:2016ZYXS19。