基于用户信息的谣言检测方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:a1263951733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以微博、论坛为代表的社交媒体平台凭借其开放性、实时性等特点迅速成为公众获取新闻消息的重要渠道。然而,社交媒体平台给公众提供了方便快捷的信息渠道之余,也带来了泛滥的虚假信息。因此,如何利用技术手段进行有效的谣言自动检测变得越来越至关重要,逐渐成为了各领域的研究热点。  针对这一任务,本文研究了基于用户信息的谣言检测方法,试图从信息源入手,找到谣言自动检测的突破口。目前基于用户信息的谣言检测方法大多数侧重利用用户的属性信息来对用户建模,而本课题着重利用用户的历史信息和关系信息,对用户的动态性和关联性在谣言检测任务上的贡献做出了更深入的研究。主要的工作包括:  基于用户历史信息的谣言检测方法:该方法基于用户绝大多数信息都是真实的,谣言只占极少数的假设,将谣言检测转化为在用户层面挖掘异常微博的异常检测问题。基于此思想,本文设计了一种基于自编码器的异常检测方法:首先,从用户行为特征,微博统计特征,文本特征等三个方面提取特征来表示用户的历史微博;然后,考虑到文本特征的时序特点,设计了基于长短期记忆网络(LSTM)的序列到序列自编码器来学习历史微博的特征表达,并基于该学习到的历史微博表达来区分谣言。实验结果从多方面验证了本算法的显著优势。  基于用户关系信息的谣言检测方法:该方法对用户的关联性在谣言检测任务上的作用进行了探究。首先,本文构建了一个以事件为单位的,包含用户和微博两类节点、三类支持关系的异构可信度传播网络。在此网络的基础上,设计了一种无监督的迭代可信度传播策略,可以同时输出用户和微博的可信度,最终,通过可信度的值对消息的真实性进行分类。在百万级真实数据上的充分实验表明,本方法显著地优于现有研究。
其他文献
蛋白质二级结构预测问题,是目前生物信息学领域中最为重要的任务之一。目前已有方法普遍存在预测准确率普遍不高、预测结果的解释性不佳、缺乏坚实的理论基础、实验科学色彩较
无线传感器网络综合了无线通信、嵌入式系统和分布式处理等多种技术,近年来成为工业界和学术界的研究前沿和热点。该技术具有广阔的应用前景,能广泛应用于国防军事、环境监测、
混成系统是一类有广泛应用的基于计算机的系统,当前混成自动机是其主要设计建模语言,对混成自动机进行可达性检验是提高系统设计质量的重要途径。目前混成自动机的可达性检验途
Web服务作为目前广为采纳的分布式计算模型,有力的整合了Internet上的各种资源。面对日益复杂的商业环境,单个Web服务往往不能满足用户的需求,这时就需将已有的单个服务进行组合
随着信息技术的发展和网络基础设施搭建的完善,我国实现数字教育所面临的主要问题是资源问题,其表现为资源孤立零乱和共享程度低两个方面。在国内,虽然也有一些教育资源网站,但这
自从上世纪90年代以来,无线传感器网络,简称传感网,成为了学术界研究的一个重要课题。传感网研究的主要目的是延伸人类的感知能力,连接物理世界和网络世界,最终为人类社会服务。本
中医理论和辨证论治的临证经验,是通过传承、实践和创新而形成的具有特色的知识体系。尤其是名老中医其独特的学术思想、辨证经验、治疗方法,疗效大都会优于同行的一般水平,所以
随着数字电网中业务数据管理及应用正不断向分布式、大型化的方向发展,数据由分散管理向集中管理转变,使得应用集成的需求不断增长,更多地需要实时连接和协调,跨平台应用之间
学位
各种近似推理和Fuzzy推理理论的逻辑基础就是各种概率逻辑和模糊逻辑系统,而逻辑系统的核心是联结词的定义。各种概率逻辑、模糊逻辑系统对于逻辑联结词定义了大量的算子,尤其
随着科技建军的目标逐步深入,我军信息化建设已初见规模。但由于技术水平的限制,目前军事信息系统应用中仍存在着很多的漏洞,集中体现在军队内部各信息系统协作程度不高,信息交流