基于社区发现好友推荐算法的研究与实现

来源 :东北大学 | 被引量 : 2次 | 上传用户:oo2009123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社交网络(SocialNetwork Services,SNS)作为一种新颖的,实用的,便捷的交友模式,依赖其真实性,稳定性等特点越来越受到用户的青睐。随着社会的发展和科技的进步,大量标志性的社交网站如雨后春笋般迅速发展起来,互联网上的信息呈爆炸式增长,人们进入富信息穷知识的时代。社交网站拥有庞大的用户群,为了更好地帮助用户维护好友关系,结识新朋友,拓展自己的社交范围,必须要过滤掉大量冗余信息,在这样背景下,好友推荐技术应运而生。虽然很多学者在好友推荐这方面做了很多研究,但最终结果都不是非常完美。通过对真实社交网站数据观察,我们发现部分用户会逐步形成一种小团体结构即社会网络中的一种社区现象或者可以理解为用户的真实社交圈。现实生活中我们大多活跃在这些圈子中,好友的来源也大多在其中,因此本文将社区划分技术融合到好友推荐算法中。论文第一部分介绍社区发现的研究的现状。重叠社区划分技术现在还处于初级阶段,目前划分结果比较好的算法有COPRA算法。本文针对COPRA算法所具有的随机性强,划分规模不可控制的问题提出了基于中心点的COPRA算法。该算法分两步进行,第一步是基于用户影响力的中心点选择过程,第二步是把中心点作为种子节点执行COPRA算法过程。在设计查找中心点算法中,对用户节点在社交网络中的影响力进行计算,根据携带不同标签的节点的UIV(User Influence Value)值来预选出代表不用社区的中心节点。把这些中心节点作为种子节点会解决原始算法随机性较强的问题,算法进一步在节点游走过程中对节点选择加以控制,减弱了原始算法划分结果规模不可控问题。第二部分是对协同过滤推荐算法的研究,引入社区发现技术之后降低了数据规模,该过程引入用户—标签属性关联强度概念,修正了用户—项目矩阵。随后采用改进的相似度计算方法确定目标用户近邻集,选出前K个用户作为目标用户的潜在好友进行推荐。最后本文采用Java语言对算法进行了具体实现,并在karate、dolphin和新浪微博的好友数据上进行了测试,实验结果表明,从评价标准上来看,本文的算法在社区发现和好友推荐方面都要优于现有的算法。
其他文献
设Ω是Rn中具有光滑边界(?)Ω的有界开区域,X =(X1,X2,…,Xm)是定义在Q上的光滑实向量场,且边界(?)Ω关于向量场X是非特征的。若X满足Hormander条件,则向量场是有限阶退化的,
在全球一体化国际交流融合不断加深的浪潮中,中国作为世界第二大经济体的国际地位日益凸显,来自世界各地的人们到中国访问交流日益频繁,其中就包括教育交流。2017年10月27日
陈铭志,是20世纪中国乐坛上著名的作曲家、音乐理论家、教育家,他的一生创作了许多具有独特风格、个性鲜明的音乐作品,《读〈聊斋〉有感》是陈铭志笔下仅有的一部声乐套曲。整部套曲音乐题材新颖神秘,旋律线条流畅,挥洒自如,既运用了西方作曲技法增加了色彩变化,又蕴含着浓郁的民族特色听起来亲切动人,是一部用现代化手法作曲的广受听众喜爱的经典之作。整部套曲由《丽人》《望乡》《晚霞》三首艺术歌曲组成,具有鲜明的民
2017年的年底,乌克兰基辅芭蕾舞团应邀来到中国进行巡演,笔者受委托负责巡演过程中的口译工作。本文为笔者在河北聚艺文化艺术有限公司担任陪同口译活动的实践报告。本报告共
本文研究了一维空间上趋化运动的双曲模型.趋化运动是一种常见的生物现象,用双曲模型研究这种现象有助于我们更科学的认识它.第一章首先介绍了双曲模型的研究概况.在第二章,
我国烟草行业自实施专卖制度以来,为经济增长和财政增收做出了巨大贡献。然而,随着供给侧改革的持续与深入,烟草行业所处环境发生深刻变化,面临着更加严峻的挑战。这就要求烟
对于棱边元离散时谐麦克斯韦方程组产生的鞍点系统,我们提出并分析了新的预条件子。这些预条件子的提出源于一个求解该鞍点系统的系数矩阵的逆矩阵的公式。这些预条件子是文
龙木错—双湖缝合带长期以来备受地质工作者研究的青睐,是探索青藏高原早期构造演化的热点,对于认识古特提斯洋演化,确定欧亚大陆与冈瓦纳大陆拼贴时间及其拼合过程等地质问
在我国房地产领域由于整体管理质量的制度标准没有得到严格的执行,并且实施方案在现有阶段并没有进行有效地落实与贯彻,从而导致相关的房地产项目质量具有一定的隐形风险存在
背景:腹腔淋巴瘤(intro-abdominal lymphoma)在影像学检查中时有发现,但因所处位置特殊性,既往获得瘤细胞及病理组织的诊断方法有:CT/超声引导下穿刺、外科手术取材。前者技