论文部分内容阅读
随着移动网络、智能手机终端和社交网络的融合,移动社交网络越来越普及,为移动用户之间的信息交流和信息共享提供了便利,也导致了广告、谣言和虚假信息在移动社交网络中的传播,对网络信息进行过滤可以延缓或阻止垃圾信息的传播。由于以往手机垃圾信息过滤技术大多根据垃圾信息的发送者或者垃圾信息的内容进行考虑,没有针对不同用户的个体特征和群体特征进行考虑,导致用户的个性化信息和社交关系无法得到充分的利用,从而造成了针对具体个体用户的垃圾信息过滤结果并不准确。本文首先对手机垃圾信息的概念、移动社交网络的相关内容以及国内外的研究现状进行了概述,对社会计算、用户相似度、众包、群智感知等在本课题中所用到的技术进行了详细的介绍,并总结了传统的垃圾信息过滤技术的研究进展。为了解决传统的垃圾信息过滤技术无法充分利用用户的个性化特征的问题,本文将手机垃圾信息分成共性化手机垃圾信息和个性化手机垃圾信息两类,然后提出了个性化手机垃圾信息过滤机制。针对两类不同垃圾信息,分别采用贝叶斯过滤器和基于用户兴趣的个性化垃圾信息过滤器进行过滤,并将两者结合,共同完成手机垃圾信息的过滤。贝叶斯过滤器用于对共性化手机垃圾信息进行过滤。个性化垃圾信息过滤器采用兴趣相似度来量化用户之间的相似程度,通过用户与好友共享垃圾信息报告的方式实现对垃圾信息的群智感知,来自不同用户的垃圾信息报告构成了本地用户对手机垃圾信息的个性化过滤。为了解决相似度计算的问题,本文对常见的相似度计算方法进行了分析,为了适应本文应用场景,提出了一种基于信息熵的相似度计算方法,用于计算用户之间的相似度。出于计算相似度和推送垃圾信息报告的需要,系统将用户兴趣信息,垃圾信息报告以数据表的形式存储在用户本地。最后,在仿真实验中,本文利用微信用户关系数据集构建虚拟移动社交网络,将个性化手机垃圾信息过滤系统应用到该网络,对过滤机制的效果及系统参数的影响进行分析。实验结果验证了本系统的过滤准确率比其他方法更高,抵抗毒药攻击方面的效果也更好。