基于概念层次树的个性化推荐算法

来源 :科学与财富 | 被引量 : 0次 | 上传用户:dzsw2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着全球信息总量的爆炸式增长,信息超载问题无法避免且日趋严重化。个性化推荐系统是当前解决信息过载问题的有效技术。下文从概念层次树入手,对基于概念层次树的个性化推荐算法的整体流程进行了详细分析和介绍,旨在为相关人员提供参考。
  关键词:概念层次树;个性化推荐;算法
  引言
  在目前的电子商务中,产品信息呈指数级增长,个性化推荐技术应运而生,它通过分析消费者的历史交易记录,获取消费者的兴趣偏好,并推荐产品或服务,节省了消费者寻找合适商品的时间。在当前的个性化推荐系统中,协同过滤及其改进算法被大多数电子商务网站所采用。基于概念层次树的个性化推荐算法就是传统协同过滤经过改进后的算法之一,大大提升了个性化推荐的准确度,对个性化推荐技术的发展具有非常重要的意义。
  1基于概念层次树的个性推荐概述
  概念层次树是将数据库中记录的属性字段根据一定的抽象程度进行归类合并而形成的层次结构。面向属性归纳方法利用概念层次技术进行概念提升,得到高度概括的表,进而将它转换成用户的特征需求,为用户个性化服务提供依据。概念层次结构是表示抽象知识的重要手段,把原始数据泛化到较高层次,实现在不同概念层次上对数据的抽象。面向属性归纳方法中用来进行概念泛化的技术称为概念层次技术,用概念层次树来表示用于泛化的背景知识,实现具体与抽象概念之间的转化。
  2概念层次树的构建
  根据关系数据库中的数据(用户年龄、受教育程度、收入、喜好等数据),为用户的每个属性构建概念层次树,使具体的属性值概化为抽象的知识并归类合并,实现在不同概念层次上对数据的抽象。概念层次树是通过树结构的形式,将具体的属性值分组,然后按照背景知识逐级提升概念。每个独立节点表示一个基本概念,它可能是一个属性的简单组,也可能是若干属性形成的复合组。概念层次树的节点可以是同一属性的不同抽象度的汇聚点,也可以是由一个概念包含的多个子概念,网站中用户的性别、年龄、职业、教育程度、收入、喜欢的书等基本信息都不同程度上对用户的兴趣爱好产生一定的影响(具体概念层次树结构图如图1-图3所示)。所以需要把这些基本信息的概念层次树构建出来,其中用户兴趣爱好这一基本信息是两层的概念层次树,与其职业相同。
  3挖掘用户喜欢的数据
  3.1划分项目种类子集
  从概念层次树中的结点属性分析,根的各直接子树包含的项目种类的属性相对独立,相互间关联最小,根(用户的兴趣爱好,如喜好的电影、书籍等)的子树——即用户兴趣爱好的分类(如电影分为ComeXy类电影、Aiction类电影、Sci-Fi类电影),它们各自包含的子类相互间差异都较大。因此对项目种类集合作如下划分,即X={Root,Xn,X2...Xn}。Root为T的根结点,X(h=1,2,3...n)为Root的子树Th中各结点(项目种类)组成的集合,n为Root的子树棵数。
  3.2寻找喜好种类的邻居
  本文需要判定用户喜好的项目种类子集。对于用户关注较少或从未关注过的项目种类,本算法将其视为用户“不感兴趣的种类”。根据实验经验值,若(访问种类子集中的项目数÷访问项目总数)<10%则视该项目种类子集为用户不喜好的项目种类,算法将不再在其上寻找邻居进行推荐,以节省系统的资源。判定用户喜好的项目种类后,在各喜好的项目种类子集Xn上,依次计算用户Ai和用户Ax的在每个集合中的PeArson相关度,其中,Fi和Fk为用户Ai和Ax对项目种类的评分,V1、V2是用户Ai、B对X中所有项目种类的平均评分,根据计算出的PeAirson相关度,选择与当前用户B最相似的K个用户作为用户Ai在项目种类子集合X上的邻居集。重复以上运算,找出当前用户Ai在所有喜好的项目种类子集上的邻居集。
  4产生推荐
  4.1评估候选项目
  在喜好的项目种类子集Xn上,选取属于该集合中的项目种类、被当前用户Ai的邻居所喜好、且未被B访问过的项目,构成当前用户Ai的候选推荐项目集,即算每个候选项目受当前用户Ai关注的程度,用权重来表示。计算权重时,重点考虑的因素如下:(1)喜好bx的邻居B与当前用户Ai的相似程度。B的偏好与Ai的越相似,B的推荐可信度就越高;(2)B对bx的喜好程度。B對bx越喜好,bx所获得的推荐权重就越高。在计算B对bx的喜好程度时可以进行如下处理:假定一个虚拟用户C,R={bx},则B对bx的喜好程度=simn(B,C)。当B访问过较多与bx同类的项目时,B对bx表现出较高的喜好程度。根据以上因素,定义候选项目权重计算公式,其中,Ai(bx)为用户Ai的喜好bx的邻居组成的集合;bx为其项目种类属于Xn的项目。
  4.2产生最终推荐
  评估所有项目种类属于用户喜好项目种类子集的侯选项目后,按权重对bx进行降序排列,得到Xn上的候选项目的推荐列表。根据当前用户Ai对不同项目种类的偏好,计算各喜好项目种类的侯选推荐项在最终推荐列表中所占比例,即numx=N*(Rix/Ri)其中,凡为喜好种类子集Xn上Ai访问项目组成的集合;N即为产生的top-N推荐的推荐项目数。从各Ph中抽取numih个项目,将这些项目按用户喜好程度的具体数值降序排列,形成对用户Ai的最终top-N推荐Py={b1,b2...bx}。
  结束语
  基于概念层次树的个性化推荐算法,相较于传统协同过滤算法在准确性方面有了显著提升,在推荐的多样性上也有了明显的改善。为了能够使个性化推荐更加精准,满足客户的需求,实现精准营销,相关人员可以将该算法部署到实际的推荐系统中,通过在线测试的方法获取用户对推荐数据的准确性和多样性的满意程度,进一步对当前的个性化推荐算法进行改进。
  参考文献:
  [1]何佶星陈汶滨牟斌皓.流行度划分结合平均偏好权重的协同过滤个性化推荐算法[J/OL].计算机科学,2018,(S1):50.
  [2]陈洁敏,汤庸,李建国,蔡奕彬.个性化推荐算法研究[J].华南师范大学学报(自然科学版),2014,46(05):8-15.
  [3]关远.推荐网络分析及个性化推荐算法研究[X].电子科技大学,2014.
其他文献
摘要:会议是企业信息交流、协调沟通的过程,在供电企业发展过程中,提高会议效率,能够集思广益、统一认识,有利于实现企业的发展目标。因此,做好会议管理工作,提高会议效率对企业的可持续发展有着重要意义。基于此,文章主要对供电企业会议分类进行了简单的分析,并对会议管理中存在的问题进行了研究,提出了提高会议效率的措施。  关键词:供电企业;会议;管理问题;措施  引言  近年来,随着社会经济的快速发展,时间
期刊
摘要:我国电力物资企业的管理中,还存在很多的不足,使得物资管理企业的定位不准确、管理手段落后,同时人员素质和业务能力水平不高,所以电力物资企业还需要能够认识到这些不足之处,并针对具体的问题采取相应的措施,有效的改善相关的问题,促进电力系统得到更好的发展。  关键词:电力企业;物资管理;有效性措施  中图分类号:F251 文献标识码A  1市场经济条件下物资管理的内容  1.1物资计划的管理  电力
期刊
摘要:软土地基是路桥工程的施工过程中经常出现的问题,如果不能较好地处理软土地基,那么就会严重影响软土路基路面的稳定性、耐久性以及平整度。因此,相关施工单位必须重视这方面的问题。文章先介绍了软土地基的特点以及软土地基处理的必要性,然后又重点探究了相关的软土地基处理技术。  关键词:路桥工程;施工;软土地基;处理技术  引言  众所周知,路基的好坏会对道路工程的质量和寿命造成直接的影响,所以,在遇到特
期刊
摘要:随着我国交通事业的不断发展,机动车的使用数量也呈现急剧增长的状态。但是机动车辆的使用寿命在很大程度上由维护修理决定,所以要想延长车辆的使用寿命,就要做好机动车辆设备的维护修理工作,提高车辆的使用性能。基于此,下文深入分析了机动车辆设备的维护修理,希望对有关人员提供帮助。  关键词:机动车辆;故障诊断;设备维护  引言  在车辆使用过程中,由于机动车辆处在不同的使用时期,其出现的故障和问题也就
期刊
摘要:时代在前进、社会在发展,工会宣传教育工作要适应新形势、完成新任务,就必须充分认识到它的重要性,深刻分析当前和今后一段时期的重点工作和任务,积极探索行之有效的工作方法和途径,使工会宣传教育真正要成为工会全局工作的“助推器”。  关键词:工会;宣传;教育  习近平同志在全国宣传工作会议上指出,坚持以民为本、以人为本。要树立以人民为中心的工作导向,把服务群众同教育引导群众结合起来,把满足需求同提高
期刊
摘要:铝合金轮毂制造因其强度高、便于制作、节约能源等特点,被广泛应用到了汽车生产中,对我国汽车行业的发展具有非常重要的意义。下文从铝合金轮毂的特点入手,对当前应用较广的铝合金轮毂制造工艺进行了分析,并对铝合金轮毂的发展趋势进行了展望,以供参考。  关键词:铝合金轮毂;特点;制造工艺;发展趋势  引言  随着社会的快速发展,人们的生活水平以及经济水平也是越来越高。汽车节能化成为了未来汽车发展的必要趋
期刊
摘要:“微時代”党建宣传工作是目前发展的重点,根据现阶段党建宣传工作的实际情况,以及结合近年来“微时代”的发展特点,分析“微时代”党建宣传工作的创新意义,可以提高党建工作效率。基于此,下文首先介绍了“微时代”下党建工作面临的机遇和挑战,然后分析了“微时代”党建宣传工作的创新意义和方向,希望对相关人员提供帮助。  关键词:微时代;党建宣传工作;机遇和挑战;创新  引言  互联网成为了人们进入新时代的
期刊
摘要:图书馆学是研究图书馆的理论,对图书馆的发展与进步具有一定的指导作用。随着社会的进步,更多的技术已经应用到图书馆中,并发挥着越来越大的作用。基于此,文章介绍了图书馆学的产生与发展过程,分析了图书馆学的学科界定及其发展规律、图书馆学体系和相关学科,最后探讨了未来观的图书馆学。  关键词:图书馆学;产生;发展规律;科学界定  引言  在中国的学术传统中,图书馆学是一门古老的学问。然而时至今世,图书
期刊
摘要:在电力供给日益稳定的当下,降低电力营销的风险性是电力营销需要不断加强的工作之一。因此,这就要求电力单位相关工作人员在实际工作中能够认识到营销稽查在电力营销管理中的意义,并把握电力营销风险管理的内容,使营销稽查对风险管理的积极作用能够得到最大限度的发挥,最终促使电力营销稽查工作的顺利推进,切实降低电力营销的风险,为我国电力事业的长远发展提供保障。  关键词:电力营销;稽查;风险管理  中图分类
期刊
一、旅游产品整合IMC路径  (一)基本概念  整合营销传播观念(Integrated Marketing Communications)是美国著名广告策略家舒尔兹(Don E.Schultz)首次提出的。80年代末,全美广告业协会(AAAA)根据对IMC所进行的研究、发展,对其定义为:IMC是一种从事营销传播计划的概念,确认一份完整透彻的传播计划有其附加价值的存在。这个计划应该评估广告、直销营销
期刊