论文部分内容阅读
近年来,随着互联网新概念的日益付诸实践,社交网络作为其中一种新兴的交友模式,受到众多用户的追崇,并在人的日常生活中发挥着越来越重要的作用,社交网络功能已经成为了现代应用必不可少的一部分,几乎可以说我们的生活已经离不开网络。从微博的应用上,可以看出,人们通过发布微博来与朋友亲人等进行便捷实时的交流与联系,并在第一时间传递重要事件的最新消息,已然成为民主监控的又一重要路径。所有的这些现象都揭示了一个讯息,即社交网络已经成为了人和机器协调复杂的自适应系统的一种方式。人们在在互联网上正常社交的同时却难免会遇到“社交网络机器用户”。正如微博中的“僵尸粉”,所谓的“僵尸粉”是指微博上的虚假粉丝,通常是由系统自动产生的恶意注册用户,一般只求数量而不重质量,是有名无实的微博粉丝。“僵尸粉”又称僵尸用户,无头像、无发布微博、自动关注是“僵尸粉”的特性,随着技术的不断升级,用软件操控的“僵尸粉”可以让现在这些特性都隐藏起来,它们就可以有头像、有发布微博、有资料、活跃度也相对比较高。“僵尸粉”的产生,自有它的市场需求,有其存在的理由及利润增长空间,但由于其缺乏网络媒体管理制度,使得网络媒体不能够主动监督自己的用户,及时解决用户不诚信等问题。从而存在以下三种危害:一是对特定用户的伤害(如诽谤他人、披露他人隐私),二是对微博公信力和诚信环境的损害,三是对微博的评价机制和估值定值机制的损害,误导公众和二次销售的购买者、广告商。因此,网络商家利用“僵尸粉”带来微博的繁荣泡沫现象以及所带来的危害需要引起人们更多的关注。本文以新浪微博平台为研究对象,针对微博平台存在的虚假粉丝——僵尸粉问题进行分析,力求研究一种能够甄别如“僵尸粉”类型的“社交网络机器用户”的算法,并开发相应应用程序,帮助真实用户清理自己的“僵尸粉”。主要运用了“相关系数”及“非奇异矩阵的线性方程组求解”等知识对数据进行分析总结,以推算出甄别算法。并在新浪微博开放平台和新浪云平台(SAE)上以PHP为编程语言基础开发甄别应用。通过用户实验验证后,达到了预想效果,能较高精确度的对僵尸粉进行甄别。但是,时代在进步,技术在更新,所谓:道高一尺魔高一丈,僵尸粉经过长时间的“演变与进化”,没有头像,不会说话,没有粉丝,也不会转发评论的粉丝已消亡殆尽,取而代之的是难以甄别的活粉,僵尸粉现阶段仍然难以根除,因此,要在新的阶段里不断的提高技术水平和加强监管力度,在技术上封杀僵尸粉市场。