大规模在线社会网络用户行为分析及反垃圾账号策略研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:meyxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Sybil账号是由恶意攻击者创建的,用来不公平的获取大量互联网资源与能力的虚假账号。长久以来,人们注意到sybil账号出现在各种互联网社区中,例如文件共享系统。但由于缺乏进行大规模测量的机遇与能力,并不能够有效地检测与测量这些sybil账号的动作方式与危害特征。  本研究和人人网合作,努力尝试使用各种方法来探测、刻画与认识sybil账号在社会网络中的活动。我们使用了由人人网,中国最大的社会网络运营商,提供的真实数据,来建立针对sybil账号的探测器,并且验证该方法,在真实的应用工业环境下进行了部署与维护。该方法在收集数据期间,共发现了超过十万sybil账号。以这些被抓住的sybil账号为基础,我们加上了人人网先前发现的五十六万sybil账号,合并获得了我们之后用来具体分析的数据集。首先研究了在社会网络人人网中,sybil账号与正常用户好友关系建立的行为模式,发现了与先前研究者的工作相反的结论:社会网络中的sybil账号并不会形成紧密的社区,相反,他们会模仿正常用户,融入真实的社会结构中。根据sybil账号好友关系建立的时间戳,我们验证发现,绝大多数sybil账号之间的好友关系,都是偶然建立的,并不是攻击者有意而为之。其次研究了sybil账号的点击流数据,根据点击流数据,我们能够从全局的宏观视角来研究个体sybil账号是如何在社会网络中交互发展的。例如sybil账号到底发生了什么样的行为,这些行为动作之间又是如何变化的。在进行更深入的工作后,调查研究了大批量sybil账号的集体行为,通过研究他们所转发分享的,包括垃圾信息spam内容的日志。结果显示,sybil账号尽管没有彼此之间直接建立好友关系,但确进行着协调一致统一受控制的攻击行为。这样表明sybil账号之间存在着大规模的集体协作,由背后的攻击者协调控制。我们的研究表明,已有对sybil账号的研究,并不能成功的适用于今天的社会网络,并且打开了一个广泛的话题,来研究如何能够更有效地防范针对社会网络的svbil攻击。
其他文献
在纺织工业界,由于各种原因存在许多遗失原始设计稿件的织物样品。通常对遗失设计稿件的织物进行再生产,就必须先由经验丰富的设计人员对织物样品进行手工临摹来得到设计稿,
在印刷行业中,图像由于其直观性和广泛适用性,对印刷品的质量起着至关重要的作用,对于承印物为织物的纺织印刷业中来说就更是如此。因此,印前图像处理便成了印刷过程中不可或
随着XML数据被广泛应用于互联网服务、信息集成等各个领域,针对XML数据的结构化查询,尤其是作为其核心操作的多分支查询,已经在研究领域成为一个热点话题。虽然在最近几年,为
计算机辅助设计(CAD、Computer Aided Design)在工业界已经得到广泛应用,极大促进了汽车、航空、航天、造船、建筑等行业的发展。离散曲面形变是CAD领域的研究热点之一,但是
任务群计算(Many-Task Computing,MTC)是广泛应用于科学计算领域的一种大规模松耦合任务并行计算模式,目的是在较短的时间内完成大量资源需求相同的可独立调度任务。这种模式下
经过多年的研究与应用实践,基于relation数据库引擎扩展XML管理功能已成为共识。目前,各大商用数据管理系统DB2,ORACLE,SQL SERVER以及开源数据管理系统(MonetDB,GALAXY,xlnd
工尺谱作为一种中国古代乐谱,常用于昆剧等中国传统音乐。工尺谱拥有完整的音调、音高标记,但是节奏标记不完备,一个节拍内音符的时值划分不明确。因此,工尺谱一般都以“口传心授
观点检索任务需要为每个用户查询返回一个文档列表,要求列表中的每篇文档表达了对当前查询主题的某种观点,并依据它们对查询主题的情感程度进行排序。目前,在微博数据(比如推
学位
随着人口信息系统应用范围的不断扩大,数据将急剧增长,简单的设施的扩容虽然能在一定时期满足人口信息系统的需求但不是长久之计。云计算的便利、经济、高可扩展性等优势吸引