论文部分内容阅读
摘要:随着移动技术的发展,社交网络已经成为互联网产品中的主体,而社交网络产生的大量关系数据可以被用来进行个性化推荐的研究。本文在社交网络数据和用户行为数据的基础之上,研究了基于社交网络的个性化推荐,提出了一种概念算法,该算法很好的模拟的现实社会中的好友推荐关系。
关键词:社会化;个性化推荐;社交网络
1.引言
随着Web2.0的推进,社会化网络产品形式也越来越多,网民也越来越多的参与到网络活动当中,与此同时,移动互联网的高速发展,更推进了社会化网络产品的兴起和流行。同样,相关技术的快速发展,也使得社会化网络产品变得越来越先进,更方便用户的使用和满足用户的特殊需求。那么目前典型的社会化网络产品的代表有博客、SNS、网络书签以及微博等。
目前互联网已进入大数据时代,大量的数据如何被充分的发掘和使用已成为一个主要议题,而社会化网络产生的产生的数据量是巨大的,这些大量的数据也可以被用来做个性化推荐研究,其原因在于基于社会化网络的推荐很好的模拟了现实社会中的推荐。现实社会中人们会信任自己朋友给出的推荐,权威机构尼尔森调查过影响用户相信某个推荐的因素,表明90%的用户愿意相信来自朋友的推荐,有70%的用户愿意相信网络商品的评价[1]。可见,好友的推荐能够增加用户对推荐结果的信任。
关于社会化网络研究目前主要分为两大类,一类是用户行为的研究,表现在研究社会化网络中人际关系与人际传播[2],社会化网络服务中的信任扩张与控制以及社会化网络服务的病毒性营销传播等;另外一类是从技术入手分析社会化网络产品,该类主要研究了社会化网络的链接预测以及社会化网络的信息扩散等[3]。社会化网络的研究已成为热点,同样利用它来研究个性化推荐是可行的。本文选用社会化网络产品中社交网络作为切入点进行研究。
2.社交网络数据介绍
社交网络在中国社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的Web2.0业务[4]。社交网络中用户之间的关系异常的复杂,想充分的利用好社交网络数据进行个性化推荐研究,首先是要分析注册网友之间的关系,目前大多使用图论进行描述。社交网络的形成是基于用户网的形式呈现的,不同的用户是网络中不同的节点。可以使用G(V,E,W)表示一个社交网络,V是用户集合,E表示边的集合,如果两个用户Vi和Vj拥有关系,就有一条边e(vi,vj),w表示权重,权重的大小可以根据需要研究需要进行不同的规范设定。
根据目前社交网络的发展情况,有三种不同形式的社交网络数据:双向确认好友关系类型,这类的网络好友需要双方互认,否则不能成功组建好友关系,代表的有Facebook、人人网等,该形式的好友可以使用无向图来表示关系;第二类是单向关注类型,用户关注其他用户的同时不需要对方必须关注自己,可以根据自己兴趣喜好选择,代表有Twitter、新浪微博等,这种形式可以使用有向图表示关系;第三种是社区小组类型,用户之间没有明确的关系,但来至于同一个“社区”拥有某些相似的特征[5]。
根据目前的发展情况,一些社交网络产品的运营商是提供数据接口的。同时,大多数的社交网络允许用户创建属于自己的页面,并且显式的展现好友之间的关系,利用这一点获取的数据是真实有效的,几乎不需要再进行二次过滤。这是目前利用社交网络数据进行相关研究的一大好处。
3.基于邻域的社会化推荐算法
与如何发掘用户之间的熟悉程度一样,发掘用户之间的兴趣相似度同样不是易事。在现实生活中,熟悉度很高的用户,兴趣相似度并非一定总是最高的,简单的来说,兄弟之间的熟悉度很高,但他们之间的兴趣相似度有可能很低。一种简单有效的发掘兴趣相似度的方法是遍历用户的喜欢商品列表,喜欢商品重合度越大,兴趣相似度也被认为最大。
综上,在充分利用了社交网络和用户行为数据之后,本文给出了上述基于邻域的社会化推荐算法,该算法看起来不是很复杂,但是移植到计算机中实现是复杂的,主要是对用户的好友关系和用户行为数据分别进行遍历,用户很多的情况下,关系网就会变得异常的复杂,而为了更加真实的描述现实中好友之间的推荐关系,不得不遍历每位用户的行为数据,然后在out(u)集合中计算寻找熟悉度高和兴趣度高的用户,这个过程对服务器以及数据分析软件的要求都非常的高。
4.推荐列表的产生
通过算法遍历每位用户的好友关系网络,找到他的好友,再遍历每位好友的行为数据,找到熟悉度和兴趣相似度最高的用户,遍历这些好友的兴趣记录,形成推荐候选列表。该候选列表中的推荐信息是按照优先排序的,排序的依据是那些出现在多个好友兴趣记录的信息排在前面。紧接着是对该列表进行过滤,主要是过滤掉那些已存在用户兴趣列表中的推荐,过滤可以使用比较遍历过滤。最后,根据预定的推荐数量选择列表中TopN信息推荐给用户。
5.总结
本文研究了利用社会化网络的个性化推荐,以社交网络数据作为背景进行相关研究,在充分的利用了社交网络数据和用户行为数据的前提下,给出了一个完整的推荐算法,该算法模拟了现实社会中好友之间的关系,算法并不复杂,但是在计算机中实现还是相对复杂的,接下来的研究可以进一步优化它的实现。(作者单位:安徽理工大学经济与管理学院)
参考文献:
[1]http://www.nielsen.com/us/en/newswire/2009/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most.html
[2]张婷婷. 社会化网络中人际关系与人际传播研究[D].长沙:湖南大学,硕士学位论文,2012
[3]王萍. 社会化网络的信息扩散研究[J]. 情报杂志,2009,28(10):39-42
[4]《2013-2017年中国社交网络行业发展前景预测与投资机会分析报告》:前瞻产业研究院,2013
[5]项亮. 推荐系统实践[M].北京:人民邮电出版社,2012
关键词:社会化;个性化推荐;社交网络
1.引言
随着Web2.0的推进,社会化网络产品形式也越来越多,网民也越来越多的参与到网络活动当中,与此同时,移动互联网的高速发展,更推进了社会化网络产品的兴起和流行。同样,相关技术的快速发展,也使得社会化网络产品变得越来越先进,更方便用户的使用和满足用户的特殊需求。那么目前典型的社会化网络产品的代表有博客、SNS、网络书签以及微博等。
目前互联网已进入大数据时代,大量的数据如何被充分的发掘和使用已成为一个主要议题,而社会化网络产生的产生的数据量是巨大的,这些大量的数据也可以被用来做个性化推荐研究,其原因在于基于社会化网络的推荐很好的模拟了现实社会中的推荐。现实社会中人们会信任自己朋友给出的推荐,权威机构尼尔森调查过影响用户相信某个推荐的因素,表明90%的用户愿意相信来自朋友的推荐,有70%的用户愿意相信网络商品的评价[1]。可见,好友的推荐能够增加用户对推荐结果的信任。
关于社会化网络研究目前主要分为两大类,一类是用户行为的研究,表现在研究社会化网络中人际关系与人际传播[2],社会化网络服务中的信任扩张与控制以及社会化网络服务的病毒性营销传播等;另外一类是从技术入手分析社会化网络产品,该类主要研究了社会化网络的链接预测以及社会化网络的信息扩散等[3]。社会化网络的研究已成为热点,同样利用它来研究个性化推荐是可行的。本文选用社会化网络产品中社交网络作为切入点进行研究。
2.社交网络数据介绍
社交网络在中国社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的Web2.0业务[4]。社交网络中用户之间的关系异常的复杂,想充分的利用好社交网络数据进行个性化推荐研究,首先是要分析注册网友之间的关系,目前大多使用图论进行描述。社交网络的形成是基于用户网的形式呈现的,不同的用户是网络中不同的节点。可以使用G(V,E,W)表示一个社交网络,V是用户集合,E表示边的集合,如果两个用户Vi和Vj拥有关系,就有一条边e(vi,vj),w表示权重,权重的大小可以根据需要研究需要进行不同的规范设定。
根据目前社交网络的发展情况,有三种不同形式的社交网络数据:双向确认好友关系类型,这类的网络好友需要双方互认,否则不能成功组建好友关系,代表的有Facebook、人人网等,该形式的好友可以使用无向图来表示关系;第二类是单向关注类型,用户关注其他用户的同时不需要对方必须关注自己,可以根据自己兴趣喜好选择,代表有Twitter、新浪微博等,这种形式可以使用有向图表示关系;第三种是社区小组类型,用户之间没有明确的关系,但来至于同一个“社区”拥有某些相似的特征[5]。
根据目前的发展情况,一些社交网络产品的运营商是提供数据接口的。同时,大多数的社交网络允许用户创建属于自己的页面,并且显式的展现好友之间的关系,利用这一点获取的数据是真实有效的,几乎不需要再进行二次过滤。这是目前利用社交网络数据进行相关研究的一大好处。
3.基于邻域的社会化推荐算法
与如何发掘用户之间的熟悉程度一样,发掘用户之间的兴趣相似度同样不是易事。在现实生活中,熟悉度很高的用户,兴趣相似度并非一定总是最高的,简单的来说,兄弟之间的熟悉度很高,但他们之间的兴趣相似度有可能很低。一种简单有效的发掘兴趣相似度的方法是遍历用户的喜欢商品列表,喜欢商品重合度越大,兴趣相似度也被认为最大。
综上,在充分利用了社交网络和用户行为数据之后,本文给出了上述基于邻域的社会化推荐算法,该算法看起来不是很复杂,但是移植到计算机中实现是复杂的,主要是对用户的好友关系和用户行为数据分别进行遍历,用户很多的情况下,关系网就会变得异常的复杂,而为了更加真实的描述现实中好友之间的推荐关系,不得不遍历每位用户的行为数据,然后在out(u)集合中计算寻找熟悉度高和兴趣度高的用户,这个过程对服务器以及数据分析软件的要求都非常的高。
4.推荐列表的产生
通过算法遍历每位用户的好友关系网络,找到他的好友,再遍历每位好友的行为数据,找到熟悉度和兴趣相似度最高的用户,遍历这些好友的兴趣记录,形成推荐候选列表。该候选列表中的推荐信息是按照优先排序的,排序的依据是那些出现在多个好友兴趣记录的信息排在前面。紧接着是对该列表进行过滤,主要是过滤掉那些已存在用户兴趣列表中的推荐,过滤可以使用比较遍历过滤。最后,根据预定的推荐数量选择列表中TopN信息推荐给用户。
5.总结
本文研究了利用社会化网络的个性化推荐,以社交网络数据作为背景进行相关研究,在充分的利用了社交网络数据和用户行为数据的前提下,给出了一个完整的推荐算法,该算法模拟了现实社会中好友之间的关系,算法并不复杂,但是在计算机中实现还是相对复杂的,接下来的研究可以进一步优化它的实现。(作者单位:安徽理工大学经济与管理学院)
参考文献:
[1]http://www.nielsen.com/us/en/newswire/2009/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most.html
[2]张婷婷. 社会化网络中人际关系与人际传播研究[D].长沙:湖南大学,硕士学位论文,2012
[3]王萍. 社会化网络的信息扩散研究[J]. 情报杂志,2009,28(10):39-42
[4]《2013-2017年中国社交网络行业发展前景预测与投资机会分析报告》:前瞻产业研究院,2013
[5]项亮. 推荐系统实践[M].北京:人民邮电出版社,2012