基于多模信息融合的个性化推荐系统的研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:lp999999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了解决信息过载的问题,我们可以通过在用户和产品之间建立二元关系的方法,利用已经拥有的比较相似的关系或者选择过程,挖掘出各用户可能感兴趣的对像。目前解决信息过载问题最有效的工具就是个性化推荐,该文利用不同的推荐算法,简单介绍了协同过滤系统,基于内容的推荐系统,基于用户—产品二部图网络结构的推荐系统,混合推荐系统。并分析这些推荐系统的特点以及存在的缺陷,帮助读者了解这个研究领域。
  关键词:推荐系统;个性化推荐系统;协同过滤;基于内容推荐;网络结构推荐
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)27-6067-02
  现如今,我们可以看到很多解决信息过载问题的方法。例如,分类目录和搜索引擎。但是这两种方法都不能满足现在用户的个性化需要。因为现在的用户更多的是希望系统能够帮助他们准确、快速地推荐出他们想要的和他们潜在的喜好信息。而搜索引擎只能向那些能够表达出准确的关键词的用户推荐产品,因此不能解决用户的很多其他需求,如果当用户不能够找到准确描述自己需求的关键词时,搜索引擎就无能为力了。而个性化推荐系统就不要求用户给出很清楚的目标,它只要了解用户过去的选择过的信息来对用户的爱好进行建模,进而主动地把那些能够满足用户兴趣需求的信息推荐给用户。个性化推荐算法的出现,让那些对自己需要不明确的用户能够找到他们的兴趣点,主动地去浏览网页。网购已经成为我们生活的一部分了,如果我们不想出门,可以到当当或淘宝网上搜索想要的产品,然后你会搜出很多相关的信息,产品数目非常巨大。同时使用网络的用户数目也很巨大。好的推荐系统能够挖掘出用户可能喜欢,而自己还没有觉察到自己喜欢的产品。尽管现有的推荐系统已经取得了巨大的成功,但是还需要在不同领域中进一步完善和发展。该文简单介绍一些实用的推荐系统和推荐算法。根据推荐算法的不同,推荐系统可以分为如下几类:协同过滤系统;基于内容的推荐系统;基于用户—产品二部图网络结构的推荐系统;混合推荐系统。
  1 协同过滤系统
  协同过滤系统是最古老的并得到广泛应用的一种推荐系统。这个算法的诞生标志了第一代推荐系统的诞生。其核心思想是,根据该用户之前购买过的产品,来推荐一些该用户可能喜欢的产品(那些和用户之前喜欢的产品相似的产品);也就是根据该用户的需求可以先找到和他有相似兴趣爱好的其他用户,然后把其他用户感兴趣的,而该用户没有听说过的产品推荐给他。
  协同过滤推荐系统的算法可以分为两类,基于记忆和基于模型。基于记忆是预测系统中所有被打过分的产品信息,注重于预测用户的相对偏好而不是评分绝对值;缺席投票就是基于记忆方法的一种扩展。基于模型是把打过分的数据收集起来进行研究来得出用户行为模型,然后,再对某个产品进行预测打分。
  协同过滤系统现在得到了很好的应用。它具有以下的优点
  1)能够帮助用户推荐那些用户本人没有发现的喜欢的产品,相对用户来说的新信息。
  2) 能够过滤难以进行基于内容分析的信息。
  虽然协同过滤推荐系统得到了很好的应用,但是也面临很多问题。由于是基于用户对产品的评分,所以不论是对新用户还是新产品的推荐,准确度都不是很高。由于用户的数量的不断增加,计算量也不断的加大,直接影响了系统的性能。
  2 基于内容的推荐系统
  基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续和发展,它是根据用户已有历史信息计算相似性作出推荐的。在基于内容的推荐系统中,产品是通过相关的特征的属性来定义,系统根据用户对产品的评价特征,研究用户的兴趣点,比较用户资料与待预测产品的相似程度。而推荐相似度最高的产品。
  基于内容的推荐算法在对信息的获取和信息的过滤两个方面的研究已经很成熟.现在有很多基于内容的推荐系统都是先对产品显示出来的文本信息进行分析,找出相似度比较高的产品进行相应的推荐.
  在基于内容的推荐系统中,我们常常把产品的内容用一些关键词来描述出来.基于内容的系统推荐,就是把不同的候选产品和用户过去喜欢的产品进行比较,然后将相似度最高的产品推荐给用户.
  基于内容的推荐系统中,通过用户的感兴趣的信息建立用户资料,把用户的兴趣点进行归纳。然后再把归纳出的几个主题文件与文本内容的相似度进行对比,把相似度较高的选择出来展示给用户并更新用户的资料。自动获取或更新用户资料的方法既要考虑用户资料的易更新性也要考虑用户资料的准确性。我们要想准确地挖掘用户感兴趣的信息那就要消耗大量的计算资源,同时也会影响到更新速度。反之,如果更新速度快,其准确性就会受到影响。我们可以通过人机交互的方法来解决这个问题。通过简单的交互式问题来收集用户的信息,从而得出用户的兴趣爱好.然后在根据获得的信息给用户进行更好的高效的推荐.
  总的来说,基于内容推荐系统的优点有以下几点:
  1)可以解决冷启动问题。
  2)可以解决稀疏性问题,用户是否对产品打分都不会影响推荐算法。
  3)能够给用户推荐出很新颖的并非很流行的产品。
  4)能够提高用户的黏附性。在给用户推荐产品时能够做出很好的解释,从而使得用户能够拥有很好的系统使用体验。
  基于内容的推荐系统在技术上还存在一些困难。假设两个相同的产品,用不同的特征词来表示,这样的产品就会被系统认为是相似的产品.又或者用相同的特征词来表示不同的产品,那么这样的产品就很不容易被系统区分.我们可以发现基于内容的推荐系统没有考虑到推荐的多样性.
  3 基于网络结构的推荐算法
  基于网络结构的推荐算法是利用用户和产品的内容特征作为抽像的节点,再把抽像的节点作为算法的信息.所有算法要用的信息全部都隐含在产品和用户的关系中。   基于二部图资源分配的算法,假设一个由多个用户和多个产品形成的推荐系统.其中如果用户A浏览过产品B,那么A和B之间就会有一条连线(生成一个结点),否则,无连线(无结点).从而,此系统可以用用户和产品之间的所有结点建立一个二部分图.图中显示对于任何一个目标用户A,推荐算法的目的是先把用户A从未浏览过的产品过滤出来,再对这些产品按用户A的喜好程度进行排列,然后把排列在前面的产品推荐给用户A.如果用户A浏览过的全部产品,都具有向用户A推荐用户A没有浏览过的产品的能力.这种能力可以看成关于相关产品的一些可再分的信息资源——拥有信息资源的产品会把更多的信息资源给予他们信赖的产品.
  提高精确度的算法有:通过去除重复属性获得高精度的算法(即二阶关联来提高算法的精确程度);通过引入耦合阈值提高算法精确性。
  这里我们要重点考虑的是,当用户的兴趣爱好相同的时候,推荐冷门的产品要比推荐热门的产品意义更大。因为有些热门产品有时对有些用户你不推荐也会购买或者浏览这些产品,而对于那些冷门的产品,如果没有好的推荐,就很难被可能喜欢他的用户发现。所以挖掘这些暗信息对推荐系统的意义也很大。一个好的推荐系统就是帮助用户发现那些他们感兴趣但很难发现的商品,满足用户的个性化需求,这也是个性化推荐系统应该主要解决的问题。
  基于网络结构的算法为个性化推荐系统的推荐算法研究指明了新的方向。但是,该算法在处理新用户,新产品等问题上还存在不足。因为在新用户或新产品第一次进入系统时(用户没有选择过任何产品,产品也没有被任何用户选择过),这个时候系统里的用户和产品没有任何信息,所以系统无法与其他用户或产品建立关联关系网络。关联网的建立时间会影响到长期兴趣点和短期兴趣点的区分及推荐的准确性。
  4 混合推荐算法
  协同过滤,基于内容和基于协同的推荐系统,它们都有各自的优点和缺点。现在有很多学者都在研究基于多种方法的混合推荐系统,并提出了混合推荐算法.经过实际数据的研究显示,混合推荐系统中的推荐算法有更好的准确率。因为它把两种不同的推荐系统结合起来,尽可能的实现他们两者的优点,不断地提高推荐系统的性能为目标的。现在,最常见的混合推荐系统是基于协同过滤和基于内容的,同时也发展出了其他类型的组合,下面简单进行介绍。
  4.1 在协同过滤系统中加入基于内容的算法
  一些混合推荐系统都是基于内容的协同过滤算法.即利用用户资料来实现传统的协同过滤计算.该算法用户的相似度与那些共同打分的产品信息无关,而是通过基于内容的用户资料计算得出。这种算法不仅可以解决协同过滤系统中的稀疏性问题,而且当产品和用户资料很相似时会被直接推荐,不再是只有当产品被用户资料相似的用户打了分才能被推荐..
  该算法通过增加一个附加打分,可以向用户推荐附加分高的信息产品.这个附加打分是通过分析文本在协同过滤系统中用户的打分向量上增加的一个打分.此外,把基于文本分析与基于网络的推荐算法相结合,值得我们去研究.我们可以从标签和关键词之间建立的关系出发,再结合于基于网络的推荐算法来实现.
  4.2 其他混合推荐系统
  基于内容和协同过滤算法的统一概率方法,把用户喜欢的数据信息通过浅层语义分析,把信息分成相关的主题,然后预测出用户喜欢的主题.该方法能够有效的解决稀疏数据的问题.混合效用回归模型是根据用户已打过分的信息,用户和产品的相关资料建立用户模型,通过回归分析进行估计和预测出用户对某一个产品特性的要求程度,来给用户推荐满足用户要求的产品.有关混合推荐系统还有,利用基于知识的方法进行的推荐(通过用户的历史行为来挖掘用户下一个喜好的内容),基于神经网络的混合推荐系统.基于知识和协同过滤的混合推荐系统(能够向用户推荐有用的知识和相关的知识).基于知识的自动问答系统(通过系统与用户的交流从中提取用户喜欢的内容)。
  4 结束语
  随着信息技术和Internet的发展,人们已经进入了信息过载的时代。大量的数据信息同时涌现在用户的面前,使得用户无从下手,很难获得他们想要的那部分信息,从而使信息利用率不断降低.相应的在现在网络中也出现了很多搜索工具,尽管他们都可以帮助用户来过滤并获取他们想要的信息.然而这些工具只能满足主流需求,没有考虑到个性化的需求.所以,仍然不能很好地解决信息过载的问题。那些“暗信息”很难被用户挖掘,如果没有外界的帮助,普通用户根本无法找到它们。采用合适的推荐算法,可以帮助用户找到用户根本就不可能找到的信息。推荐系统的作用就是帮助用户和信息之间建立相应的联系。一方面帮助用户发现对自己有价值的感兴趣的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢.
  文中根据4种不同的推荐系统简单地介绍了几种不同的推荐算法。虽然这些推荐系统都有一定的应用领域,并且取得了巨大的经济利益。但是这些系统不管从理论角度还是从应用角度来看都面临着许多问题,还需要进一步的深入研究。
  参考文献:
  [1] 项亮.推荐系统实践[M].北京:人民邮电出版社,2012
  [2] 刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19.
  [3] 刘晓波.基于关联规则的电子商务商品推荐系统研究[J].中国市场,2008,17(52).
其他文献
在ORACLE数据库中,为了确保数据的完整性和一致性,提供了事务处理机制。该文详细阐述了事务处理的运行机制和实现方法,最后用实例说明事务处理的整个过程,为程序员提供了一个
本文将主要从电力线路的设计的基本原则入手,对并对不同地理条件下的设计技术进行探讨,最终全面分析了提高电力线路设计水平的相关策略,以供相关人士借鉴与参考。
针对当前JSP课程在教学中存在的问题,该文以提高学生的专业能力为目标,在教学内容、教学方式和考核方法上分别进行了探讨和改革。教学实践证明,这些课程改革措施有效地提高了
本文针对吉林省西部面临的生态与经济问题,以生态经济理论为指导,对复合农林业概念、主要模式、发展前景进行了论述,提出复合农林业是实现吉林省西部跨越式发展的理想模式,并
西宁市新宁路上,数千米之内有两个在全国著名的科研单位,一个是西北高原生物研究所,一个是青海盐湖研究所。这两家研究所,是我国最高科研机构中国科学院的下属单位,分别研究
标准工艺是提升输变电工程建设质量的有效途径,推进标准工艺的深化应用可以提高输变电工程建设水平。本文从标准工艺的内涵与应用价值、在送电线路施工技术中的应用等方面进
<正>2017年6月17日零时至24日零时,青海省在全国首次连续7天168小时全部使用清洁能源供电,所有用电均来自水、太阳能以及风力发电产生的绿色能源。据国网青海电力调控中心负
一、农村薄弱学校开展教师培训面临的问题受客观原因的制约.农村薄弱学校开展教师培训的效果不容乐观.分析其主要原因为:
左边这张图片由伊拉克政府于今年1月份发布,这张照片上,巴格达迪留着络腮胡,穿着西装,不苟言笑。照片比较模糊,似乎是有人翻拍过来的。  巴格达迪领导着“伊拉克和黎凡特伊斯兰国”组织(简称ISIL),他是一个精明的战略家,是一个有号召力的资金募集者,同时是一名杀人不眨眼的魔头,美国曾经悬赏1000万美元抓捕他。  阿布·巴克尔·巴格达迪于1971年在萨马拉(伊拉克一城市)出生。根据恐怖分子发布的档案,