数据挖掘技术在个性化电子商务中的应用研究

来源 :西江文艺 | 被引量 : 0次 | 上传用户:moneyNUMBER_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】:随着信息技术和商业信息化的不断发展,在电子商务的基础上发展出来了O2O模式,用户对于提供消费的商家提出更高的要求,用户希望自己享受个性化服务,商家能根据以往消费记录来推荐用户所需要的个性化信息,而数据挖掘技术能为用户个性化需求提供支持平台。以此为目标,本论文在用户需求的基础上,以数据挖掘技术和个性化需求服务为切入点,应用协同过滤算法,对该问题展开研究。
  【关键词】:电子商务;协同过滤;个性化推荐
  一 引言
  随着计算机网络迅速发展,人们的购物方式也产生了变化,电子商务对传统的交易方式产生了重大的冲击,用户在网上购物的需求日益扩大,为了服务客户,电子商务开始向“以客户为中心的商业模式“进行转变,为了方便客户在海量信息中快速找到自己所需要的信息,对客户提供个性化服务成为了必要,在这个背景下,电子商务个性化推荐系统就产生了,它可以根据各人的浏览购买记录,提取各人喜好,从中分析出具有相似口味的用户或相似物品,从而对用户进行商品推荐。帮助用户更快,更好的找到自己所需要的东西,从而为每个用户提供个性化的服务
  二,基于协同过滤的个性化推荐过程
  现在个性化服务系统使用较多的技术有协同过滤技术,基于内容推荐,基于知识推荐等,协同过滤技术是目前研究最多,应用最广的个性化推荐技术。
  协同过滤技术与传统的基于内容过滤直接分析内容推荐不同,它根据用户历史浏览或购买信息,协同过滤分析用户兴趣,综合相关信息对指定用户的信息喜好进行预测。
  实现协同过滤技术,需要进行以下三个步骤:
  一,收集数据,收集用户的历史行为数据,给接下来使用的推荐算法提供材料。
  二,计算相识度,选择合适的计算相似度算法,如:
   欧几里德距离,计算欧几里德空间中两个点的距离,距离越小,相识度越大。
  皮尔逊相关系数,计算两个定距变量间联系的紧密程度,取值在[-1,1]之间。
  等等方法
  三,进行相似度计算后,我们可以进行协同过滤来进行推荐物品,协同过滤技术分为两种主流方法,基于用户的协同过滤技术和基于物品的协同过滤技术,基于用户的协同过滤是通过对用户的历史记录的研究,根据用户对物品的偏好,发现相似度较高的邻居,将邻居感兴趣的东西推荐给用户。基于物品的协同过滤技术是指在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。
  在大部分的电子商务站点中,用户既想找到与购买的物品相似度较高的东西,也乐于参考别人购买的信息,两种方式各有各的优点和用途。基于以上,我认为电子商务网站应该70%进行基于物品的协同过滤推荐,30%进行基于用户的协同过滤推荐。
  三,推荐系统整体框架设计
  3.1用户特征
  在用户访问系统时,推荐系统需要给每个用户生成相对应的特征,再根据相对应的特征来进行资源挑选,比如用户喜欢的物品是一种用户特征,和用户相似的人是一种用户特征,通过这些特征最终为用户生成推荐列表,整个过程大致可分为两部分,一是为用户定义特征,二是根据特征为用户推荐相对应的资源
  由于是电子商务购买,特征可分为以下几类:
  用户行为特征:包括用户的浏览和购买记录,并且可以从时间上分为近期和远期行为,优先近期行为。
  用户特征标签:包括用户自己选择特征标签和从历史行为中提取出特征标签,将一个特征标签内的用户尚未浏览的商品推荐给用户。
  综上所述,我们可以采用多个推荐引擎组合推荐,每个推荐引擎負责一类特征,根据权重进行计算。
  3.2特征向量的形成
  特征向量形成有两种,一种是用户直接填写选择,如自己选择自己的标签类型,另一种是根据用户的行为历史记录进行处理,形成自身的标签。
  形成自己的标签类型主要由历史行为和行为的权重组成,如我们要从历史记录中提取用户的行为特征,我们参考的行为主要是物品种类,购买和浏览记录,在这些记录中,购买记录比浏览记录更能反映一个人的购物倾向,则购买记录的权重远远大于浏览记录,近期记录权重大于远期记录等。
  通过提取的特征(如这个物品是浏览还是购买,购买时间等),加上设定的特征相关权重,进行计算后,我们可以得到初始的物品推荐表。
  3.3过滤模块设计
  在推荐列表中,有一些情况是需要过滤的
  比如推荐列表中有客户已经购买或浏览过的商品
  去除已经购买或浏览过的商品可以提高用户选择的效率,不做无谓的推荐
  某些评价很糟糕的商品
  商品评价糟糕,从一方面来讲,是不值得推荐的商品,推荐这种商品会拉低用户对网站的评价。
  3.4排名模块
  可以将推荐的资源进行分类,将每不同类别,不同筛选方式中排名较高的资源组合起来,形成新的推荐列表,有利于推荐列表多样性。
  四,基于物品的协同过滤
  4.1基于物品协同过滤算法
  基于物品的协同过滤是指,通过用户历史记录,发现喜欢A物品的用户往往喜欢B物品,若一个用户购买A物品而从未浏览过B物品,此时,系统将会把B物品推荐给用户。
  根据以上思想,我们可以计算物品相似度。
  I为喜欢A物品的用户数,j为喜欢B物品的用户数,M(i,j)是同时喜欢A,B物品的用户,W(i,j)=M(i,j)/(i+j),W(i,j)越大,則A和B相似度越高。
  首先建立一个总矩阵C,每个用户建立自己的兴趣矩阵,如用户1喜欢A,C,D物品,用户2喜欢A,B,D,则建立矩阵并汇总到总矩阵C:
  
  将C矩阵归一化可得相似矩阵W,得到相似矩阵w后,用如下公式计算用户u对物品j的兴趣
  其中,是用户U对j物品的兴趣,是用户购买或浏览过的物品,是和j相似的k个物品。是指i和j的相似度,是指用户对i的兴趣度。这个公式的意思是,在通过和物品j和物品j有相似关联且在用户历史记录存在的物品i之间的计算,总相似度越高,则越可能或者较高排名。
  4.2基于用户的协同过滤推荐
  若用户A需要推荐,可以找到与用户A相似的用户,用户B,将用户B喜欢的而用户A没有浏览过的物品推荐给用户A
  建立总矩阵c,一行或一列表示一个用户,用户之间两两计算,总共有A,B,C,D物品,如用户A喜欢A,B物品,用户B喜欢A,C,D物品,用户C喜欢B,C,D物品,得到A,B喜欢相同物品为1个,A,C喜欢相同物品为1个,B,C喜欢相同物品为2个,则总矩阵C如下图所示:
  A B C
  A 1 1
  B 1 2
  C 1 2
  将C矩阵归一化得到用户之间的相似矩阵W
  得到相似矩阵W后,可以用如下基于用户的协同过滤算法进行计算
  是和用户u相似的k个用户,是指对i感兴趣的用户,是指用户u和用户V之间相似度,是指用户v对i兴趣度,这个公式的意思是,在通过和物品i和對物品i感兴趣的和用户u较相似的用户u之间的计算,得到相似度越高,則越可能或者较高排名。
  五 结束语
  本文围绕如何将数据挖掘技术应用到电子商务个性化系统中,开展以下几方面研究,分析和研究个性化系统的工作原理的相关理论,对个性化推荐系统做了系统介绍;研究总结个性化推荐系统整体架构设计,用户特征向量形成,对过滤模块和排名模块设计并对其进行分析;研究个性化推荐系统中物品推荐模块,基于物品的协同过滤和用户的协同过滤给用户推荐感兴趣的资源。随着网络高速发展,推荐系统将会获得越来越普遍的应用,基于协同过滤的推荐算法使商务资源得到更加合理的应用。
  
  基金项目:本项目得到西南民族大学中央高校基本科研业务费专项资金项目优秀学生培养工程项目的支持,项目名称:数据挖掘技术在个性化电子商务中的应用研究,项目编号:2016ZYXS19。
其他文献
【摘要】:移动图书馆的建设是高校图书馆在移动技术、网络技术、云计算技术等方面发展的必然趋势。本文从理论层面对高校移动图书馆建设的特点进行分析,并提出了高校移动图书馆建设的若干原则。  【关键词】:移动图书馆建设;个性化服务;移动服务  1 从数字图书馆到移动图书馆  1.1移动服务是图书馆服务功能的进一步延伸  移动服务是传统图书馆和数字图书馆信息资源服务功能的进一步延伸,是高校图书馆的一个全新的
期刊
【摘要】:现代我国正处于社会主义法治社会构建时期,证据法运行机制与社会控制功能成为法律学者研究重点。但受多种因素影响,出现了很多社会失范现象,这种情况的出现与我国证据制度规则缺位有关,而证据法则具有解决社会失范的作用,因此,本文将重点研究证据法的运行机制与社会控制功能。  【关键词】:证据法;运行机制;社会控制  前言:  在改革开放以后,我国经济发展速度不断加快,国民生活发生了翻天覆地的变化,但
期刊
【摘要】:中国作为文物大国,从1840年左右直到当今,由于战争劫掠、偷盗走私、非法交易等多种原因,使大量的珍贵文物非法流失到海外。在此背景下,本文从概念界定、我国流失文物追索存在的现状及问题以及提出的相应法律对策这三个方面进行了研究。  【关键词】:流失文物;追索;法律  一、概述  (一)流失文物  有关流失文物的定义,中华化会文化发展基金会抢救海外流失文物专项基金曾指出流失文物是专指1840年
期刊
【摘要】:近年来随着犯罪低龄化的趋势增加,未成年人犯罪越来越频繁,未成年人做为这样一个特殊群体,对他们的预防和矫正是整个法律体系中重要一环。但专门针对未成年犯罪的法条散落于各个法条中,没有形成体系,这样不利于保护未成年人的合法权益,引导未成年人成长。虽然我国在2012年对未成年人刑事诉讼案件有了专门规定,但仍然有研究的必要,通过进一步细化全面的了解未成年人刑事诉讼制度,从而能更好的保护未成年人。 
期刊
【摘要】:我国的法理学从出现到发展至今,经历从幼稚到成熟。既经历了成为外部政治的简单回应,也经历了全部的从其他国家借鉴,终于形成了具有我国特色的法理学。我国的法理学不断地进步。形成自己学科的品格,建立了自己学科的独立性,生成了自己学科的逻辑,逐渐的减少了政治学的影响,将去政治化进行到底,中国法理学新时代的使命是反思与创新,继续的深化改革达到在制度中关怀人、在实践中实现人的价值的理想状态。  【关键
期刊
【摘要】:本文主要从生态主体功能区建设入手,以县域生态主体功能区建设为对象,探讨县级区域的生态文明建设的伦理价值与规范,旨在研究县级生态文明建设中的生态伦理学理论与实践的关系是什么,应样处理这种关系?最后提出几点关于县域生态环境实践活动中的建议。  【关键词】:生态功能区;县域生态;伦理价值  一、研究背景、目的及意义  党的十八大报告中指明了“建设生态文明,是关系人民福祉、关乎民族未来的长远大计
期刊
【摘要】:刑事和解制度是具有中国特色的一项司法制度,具有自主性、恢复性和缓和性的特点,同时体现公正和效率的价值。我国为刑事和解制度的建立提供了刑事政策和法律基础的保障。但是我国刑事和解在滥用职权现象明显、加害人保障和人人平等原则贯彻等方面存在不足,因此应在立法方面加强监督机制,完善加害人刑事和解的保护制度,以确保实现和谐社会的价值理念。  【关键词】:刑事和解制度;公平公正;和谐社会  一、刑事和
期刊
【摘要】:火锅历史悠久,在现代商业背景下火锅具有更加多样的形式,作为餐饮业的三大支柱之一,商业结构比例格局在调整,购物、餐饮、娱乐的比例格局由7:2:1转变为5:3:2,一些新开的商业综合体中餐饮比重更是升至总量的40%-50%,餐饮业渐渐成为商业综合体的主力军。[ 2015中国餐饮现状分析]火锅又是四川美食的代表,在发展过程中不断创新,服务,装修,菜品等都在不断提高,火锅数量的大规模增加,其实是
期刊
【摘要】:环境与我们每个人的生活息息相关,我们每天衣食住行都和环境紧密的联系在一起,但是我们对周围的环境问题却一直抱怨,企业污水没有经过处理直接排放到河里、企业的废气没有处理直接排放到空气中、企业的废弃垃圾没有经过处理直接堆放在路边……,这些本应该由企业负责的事情,由于企业是以经济利益最大化为目标,而对这些问题不管不顾,因此需要国家行使强制性,对企业的环境问题进行立法,使企业承担环境责任。  【关
期刊
【摘要】:西藏自治区作为占我国面积八分之一的大省,在经济的日益增长的环境下,原有的交通运输设施已经不能满足高速增长的经济的需求,而青藏铁路的建成通车为西藏经济继续高速发展创造了良好的条件。  文章通过分析西藏交通运输基础设施在经济发展中的作用, 并在此基础上得出了青藏铁路的建成,打破了西藏交通运输的“瓶颈”,更进一步促进了当地经济社会的协调发展。  【关键词】:青藏铁路;西藏经济;道路交通  1.
期刊