考虑用户预算的商品推荐算法

来源 :科技风 | 被引量 : 0次 | 上传用户:fengfeng1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:在本文中,作者在基于物品的最近邻推荐的基础上引进了用户的上下文信息来修正推荐结果。具体说来是考虑了用户的消费预算,可以在原来的物品最近邻推荐的基础上更加符合用户的偏好,从理论上来说,这种机制是可以改进推荐的效果的。基于这种思想,作者给出了具体的推荐算法。
  关键词:用户预算;基于物品的推荐;上下文信息
  1.引言
  随着电子商务的兴起,网购网站的规模越来越大,用户面对的选择越来越多,为了解决这个问题,网购网站都为自己的的网站添加了推荐的功能。推荐系统一定程度上为用户解决了信息过载的问题,增加了用户的购物效率,同时也增加了网购网站的利润。
  在本文中,作者考虑的是这样一个场景:用户已经在购物车中添加了一系列的商品,但是还没有最终付款,针对购物车中已近添加的一系列商品,系统可以为用户生成一个推荐列表,推荐列表中商品可以和购物车中的商品组合起来使用户达到最大的收益。作者考虑的用户上下文信息是用户的购物预算。在购物的过程中,用户基本上都会对自己的消费在心里设定一个预算,当消费额在预算范围之内时,用户最终购买的概率远大于消费额超出预算范围的情况。所以,在设计推荐机制的时候要考虑这一点。尤其,在作者考虑的这种场景下,当用户选定需要购买的商品后,系统根据购物列表进行推荐,推荐的商品会和购物车中的商品有很大的关联性。而且特别是当二者组合起来的消费额仍然低于自己的预算,甚至二者组合起来会有某种折扣的时候,用户会以相当大的概率接受系统的推荐。这中心理可以解释为个体在经济活动中总是追其利益最大化,而人在购物的时候总是想要花少量的钱获得更多的物品。
  基于上面的介绍,作者针对前面提到的场景设计了一种推荐机制,这种推荐机制是通过在基于物品的最近邻推荐[2]的框架内引进用户消费预算的限制来实现的。为了实现这一点,作者对商品进行了形式化描述,在此基础上,给出了相似度的计算方法,然后分析了用户和网购网站的期望收益。在这之后,作者给出了系统的设计思路,最后进行了总结。
  2.推荐模型
  假设一个网购站点中商品种类的集合为G={g1,g2,g3…gn},G的子集组成的集合为S。为了下面表述问题的方便,定义函数:
  pay:s→R+U{0}(1)
  x∈S表示一个商品列表,pay(x)表示用户一次购买列表中所有的商品需要支付的钱。因为存在一些优惠组合,所以函数pay满足:
  x,y∈S,x∩y=→pay(x)+pay(y)≥pay(x∩y)(2)
  x,y∈S,下面需要计算出x,y之间的关联性,这是推荐的基础,本文中用v(x,y)表示x,y之间的关联性。具体的度量方式可以采用余弦相似度,它可以通过用户的历史消费记录来计算得出。实验证明,在基于物品的最近邻推荐中,余弦相似度比其它的相似度度量有更好的表现。而且,Google的YouTube系统中使用的推荐算法的演变也可以很好地说明这一点[3]。
  至于用户的预算,用θ表示用户的预算值,预算的值是不公开的,但是可以认为预算的概率分布情况是公开的。假设预算的取值范围为 θ∈[a,b],预算分布的密度函数为f(θ)。
  推荐的思想可以形式化地认为是推荐可以最大化目标函数的参数,最常用的目标函数是相似度函数。只考虑相似度的缺点在本文的前半部分已经有了相应的分析。本文中,作者引进了用户的消费预算来修正这个缺点,具体到目标函数的构建上,作者在相似度函数的基础上做了一些修改得到了一个新的目标函数。定义目标函数为V:S→R,对于x,y∈S,xI y=设x是已经存在于用户的购物车中的商品列表,那么有:
  V(x,y)=a*w*[pay(x)+pay(y)-pay(x∩y)]+β*v(x,y)(3)
  目标函数中的后一部分是用户已有的购物列表和推荐的购物列表之间的关联度,它度量了推荐的购物列表满足用户需求的程度;前一部分表示的是如果用户接受推荐可以获得的直接的经济利益,这对用户具有很大的吸引力,因为用户总是想花更少的钱来得到更多的东西,这一点在前面也已经有相应的叙述。α,β是常数。这种将相似度进行线性组合得到新的目标函数的思想来自混合推荐[1]。
  其中w表示如果用户接受系统推荐,最终的消费额不超过自己的预算的概率,可以通过下面的方法计算得出:
  w=∫bpay(x∩y)f(θ)dθ[]∫bpay(x)f(θ)dθ(4)
  实际上这个结果是一个条件概率,因为用户已经选择了购物列表x,那么就说明他的预算θ满足θ≥pay(x),那么后面接受系统的推荐后总的预算是否会超过自己的预算都在这个前提下进行讨论。
  假设用户的购物车中已经存在购物列表e,那么推荐的结果为:
  r=argmaxV(t,e),t∈S∧t∩e=(5)
  至此,叙述了推荐算法的完整思路。
  推荐模型的核心是计算目标函数的值,而目标函数的值是由两个部分组成。第一部分是计算两个对象之间的相似度,可以通过离线计算得到,因为这个部分的值是相对稳定的,所以这一部分的计算可以独立为一个模块。目标函数的第二部分需要根据用户的购物车列表来计算出概率以及经济收益,这个部分的值需要实时生成,无法通过离线计算来生成,也要独立为一个模块。最终的结果需要将两者组合起来,所以生成最终的推荐结果的过程也可以独立为一个模块。
  3.总结
  在这篇文章中,针对现在推荐系统中系统挖掘的用户偏好滞后于用户的实际偏好的情况,考虑了用户的上下文信息。具体说来就是在传统的推荐系统的框架内引进用户的消费预算来修正推荐结果。并且基于这种思想提出了具体的推荐算法。总的来说,这是一个尝试,随着移动互联网甚至物联网的兴起,用户的上下文会变得更加多样化,而传统的推荐系统会显得更加无力。那么在设计推荐系统的时候考虑用户的上下文就显得很有必要。下一步的研究可以考虑细化上下文的信息,考虑在上下文中纳入用户的环境,服务的环境,用户使用服务的差异以及商品的差异。
  参考文献:
  [1]《推荐系统》,(奥地利)Jannach,D.等著;蒋凡译,北京:人民邮电出版社,2013.7.
  [2]B.M. Sarwar et al., “Item-Based Collaborative Filtering Recommendation Algorithms,” 10th Int’l World Wide Web Conference, ACM Press, 2001, pp. 285-295.
其他文献
摘 要:伴随城市化进程的加快,对城市防洪排水提出更高的要求。然而从当前城区小流域暴雨洪水计算情况看,现有的计算方法并不能完全满足洪峰、洪量计算要求,更无从谈及适应洪水调节需要,这就要求对现有的计算方法进行优化。本次研究将对城区小流域特征做简要介绍,并结合当前城区小流域暴雨洪水计算常用方法与弊病,提出相关的优化策略。  关键词:城区小流域;暴雨洪水计算方法;优化  城市防洪作为当前城市建设考虑的内容
城市轨道交通综合监控系统主要用于对地铁全线电力、环控、火灾报警等系统的状态、性能等数据进行实时地收集及处理,本文大体简述了天津地铁一号线东延线综合监控系统的构成,
摘 要:矿山开采已经进入机械化时代,在开采过程中经常会使用到一些机械设备,然而在对这些设备进行使用中经常会出现一些问题,除了使用者使用不当之外,在对矿山机械设备日常维修管理上也存在着一些问题,没有对机械设备进行及时的保养与维修,造成设备不同程度损坏。为此加强矿山机械设备的保养与维修,延长其使用寿命,显得意义重大。本文分析了矿山机械设备保养与维修中存在的问题,并提出了一定的解决措施,为今后更好的进行
随着我国电力行业的的快速发展,地铁交直流电源装置分为A、B、C型盘,其中A型盘为双回路、双蓄电池组同时进行供电;B、C型盘为单回路、单蓄电池组进行供电。因此在进行充放电
摘要:本文主要以文献法为主要科学研究方法,以中国新农村建设中农村群众文化的作用为研究重点,认为在现实的中国新农村建设中农村群众文化的作用主要表现在三个方面,分别为:农村群众文化建设有利于提高农民精神文化素养;农村群众文化建设有利于整顿当前我国农村混乱的文化市场和农村群众文化建设有利于我国农村人才的培养等。基于农村群众文化在新农村建设中的重要作用,各级政府要正视农村的群众文化建设,将农村群众文化建设
摘要:本文简要总结了《寒潮等级》(GB/T 219872008)标准在实际业务运行中的应用现状,具体分析了标准的应用情况及应用中存在的问题,并提出了意見和建议。  关键词:寒潮等级;标准应用  1 概况  2008年11月1日开始实施的国家标准《寒潮等级》,统一和规范了我国单站、区域及全国的寒潮强度等级标准,使寒潮的监测、预报、预警、评估、研究及防范工作更规范化、标准化、科学化,改变了过去南北方采
摘 要:在我国自动化、机械化程度不断提高之下,在机械制造领域当中已经开始广泛使用工业机器人,而工业机器人控制器也越來越标准化,其开放度也逐渐提升。在工业机器人当中,软PLC系统是其中至关重要的一项组成部分,符合逻辑控制以及总线通信等工作。本文将在此背景之下,着重围绕基于面向工业机器人控制器的软PLC系统软件开发进行简要分析研究。  关键词:工业机器人;控制器;软PLC系统;软件开发  在工业机器人
摘 要:本文以某输电线路工程在实际中的应用为例,阐述了输电线路基础安全的无线自动化检测方法。  关键词:输电线路;基础安全;自动化检测  在输电线路的杆塔设计中,基础的上拔与抗倾斜性能要必须得到控制。而位于斜坡环境中的杆塔基础,所涉及的边坡最小保护长度也要符合相应的标准规范。不过,在斜坡处的杆塔基础最容易被地质波动所影响。而如果杆塔的边坡出现滑坡和坍塌等问题,就会使得相应的临坡基础转化为的斜坡基础
摘要:花生营养丰富,兼具经济价值、药用价值及食用价值,深受大众喜爱。延津地处黄河故道区,土地、气候等条件均适合花生生长。该文结合延津县近30 年气候资料,着重从环境条件方面分析在延津县种植花生的优势,探讨其在延津县高产优质的气候条件,并提出相关建议和措施。  关键词:花生;气象条件;生产建议;延津  花生果具有很高的营养价值,内含丰富的脂肪、蛋白质、多种维生素及矿物质,科研人员研究表明花生有“小人
期刊