【摘 要】
:
随着社交媒体的日益流行,人们已经改变自己获取信息的方式。网络已成为人们与外界沟通的桥梁。但是,网上的许多信息真实性都是可疑的,有的新闻甚至有意误导他人。一方面,这些虚假谣言的传播会大大降低媒体的公信力,充斥虚假言论的社交平台也会逐渐丧失受众的信任;另一方面虚假谣言的传播也可能会对人们的政治和经济生活造成非常严重的破坏。因此虚假谣言的检测,对个人和社会而言都有非常重大的意义。传统上,这种真实性的核查
论文部分内容阅读
随着社交媒体的日益流行,人们已经改变自己获取信息的方式。网络已成为人们与外界沟通的桥梁。但是,网上的许多信息真实性都是可疑的,有的新闻甚至有意误导他人。一方面,这些虚假谣言的传播会大大降低媒体的公信力,充斥虚假言论的社交平台也会逐渐丧失受众的信任;另一方面虚假谣言的传播也可能会对人们的政治和经济生活造成非常严重的破坏。因此虚假谣言的检测,对个人和社会而言都有非常重大的意义。传统上,这种真实性的核查是由专家和新闻工作者通过将发布的信息与既定事实进行比较并与可信赖的替代来源进行交叉核对来进行的。但在各种社交媒体平台上,谣言的传播速度很快,类别又非常多样,这导致社交媒体上的谣言检测工作难以取得有效的成果。因此,本文从微博的谣言数据中提取出了文本特征、情感特征、用户特征、传播特征和其它辅助特征,并提出了基于图卷积神经网络的谣言检测模型。本文的主要研究成果如下。1、对谣言和非谣言数据分别进行了可视化分析。本文构建了一个从单词、微博发文或微博评论到谣言的层级注意力模型。层级注意力模型具备一定可解释性,能提取并展示谣言在情感表达等方面的典型特征。本文对可视化结果进行分析,发现假谣言和非谣言数据在情感、立场和语义上有着明显的区别。这对于特征工程和设计更符合谣言检测任务的神经网络模型有着重要的指导意义。2、特征工程。本文通过结合多个情感词典,获得了微博发文和微博评论的情感类别、情感极性和情感分数特征。其它提取的基于文本内容的特征包括表情包,标点符号,人称代词等统计特征。基于用户的特征包括用户的性别,粉丝数等。通过实验验证,这些手动提取的统计特征在一定程度上提升了模型的表现。3、构建了谣言检测模型对谣言数据进行预测。图卷积模型能从谣言数据中提取到谣言传播特征,得到更好的谣言数据表示。为了获得更丰富的数据表示,本文不仅构建了基于文本的图卷积模型还构建了基于情感特征的图卷积模型,来分别提取谣言文本本身的传播特征和谣言情感的传播特征。通过实验验证,对谣言情感传播特征的提取在一定程度上提高了模型的表现。
其他文献
在大规模复杂规划问题当中,通常面临着初始状态中的对象集合及命题集合过大的问题,一方面,这影响规划求解的效率,容易引起搜索空间爆炸;另一方面,也影响了规划问题的具体实例化过程,导致很多问题无法在有限的计算资源内完成实例化。然而,研究发现,很多规划对象,以及与之相关的谓词、动作,对实现规划目标并不重要或不必要,如何区分这些对象的重要程度,并在规划预处理和规划搜索过程当中合理的约减和使用,是智能规划领域
经行水肿湖北省公安县孟家溪镇中医院(434322)邹立勤王某,35岁,已婚。1978年4月6日初诊。每逢经期眼睑及双下肢凹陷性水肿2年余。长期以来,月经衍期或无定期,量多.色暗红。经前常感胸脘痞胀。神疲食少。曾到上级医院检查,未发现脏腑器质性病变。前...
目的:探讨首荟通便胶囊对原发性肝癌患者载药微球介入术后便秘的影响。方法:回顾性筛选出临沂市肿瘤医院2019年7月至2021年8月收治的原发性肝癌患者,以接受载药微球介入术治疗后发生便秘的92例患者作为研究对象,根据使用通便药物的不同分为2组,口服通便灵胶囊的患者作为对照组,口服首荟通便胶囊的患者作为观察组,以治疗后中医病症临床疗效、便秘症状疗效、不良反应发生情况为具体评价指标。结果:治疗后,2组患
《射雕英雄传》是金庸武侠小说中极受欢迎的作品,在中国和其他亚洲国家广泛传播。外国译者郝玉青翻译第一卷和中国译者张菁翻译第二卷的英译本是第一次实体出版的版本。《射雕英雄传》英译本在国内外广泛传播,受到普通读者好评。金庸武侠小说英译最初三部作品都是由外国译者翻译。通过研究最新的《射雕》英译本,不仅可以对比中外译者采用的翻译策略和翻译方法并从改写理论的视角出发,分析意识形态和诗学对两位译者改写的影响,还
自2011年在中国开服发行至今,《英雄联盟》走进它的第二个十年,在第十一年里,这款MOBA游戏依然热度不减,无论是在玩家热度方面,抑或是电竞赛事热度方面。事实上,《英雄联盟》走入中国是在该游戏本地开服约两年之后,和LOL在其它国家取得成功类似,本地化后的《英雄联盟》在中国也取得了不俗的成绩。本文利用操纵理论,分析该游戏的本地化现象,探讨意识形态、诗学,与赞助人如何影响了游戏本地化的进程。本文结合线
本论文主要讨论了孤独唐诗的不同英译的优缺点,目的是找到这类以孤独美学价值为特征的唐诗英译的困难和解决方法。研究唐诗英译有助于唐诗在国外的传播,并且能给予译者在翻译此类唐诗的建议。在钱钟书的“化境理论”指导下,本论文主要研究了三种孤独:孤高,凄凉和恬淡。在每一种孤独风格中,作者讨论了各自翻译中的困难并给出解决方法。对于孤高类,翻译难点主要包括环境描写和对诗人的隐喻。环境描写又分为视觉描写和想象,翻译
由于缺乏足够口译人才储备,中国应急语言服务体系需要志愿者参与。2021年上海市人民政府外事办公室招募语言专业大学生为在沪外籍人士疫苗接种提供志愿口译服务,该项目中口译员的身份有三大要素:医疗口译、非专业译员和志愿者,促使口译员承担非典型的角色,然而学界尚未对志愿者口译员充分探讨。戈夫曼的“参与框架”界定了“听者”和“说者”的角色,其中“说者”可分为发声者、作者和责任者,本文聚焦在该理论框架下的“说
人体姿态估计是计算机视觉中的重点研究领域之一,并长期成为许多专家学者的研究热点。其目标是在输入的人体数据中准确定位出人体关节,例如耳朵、鼻子、手腕等。利用这些人体关节信息,可以构建人体的骨骼表示,从而理解人体行为。最近几年,基于卷积神经网络的人体姿态估计技术受到越来越广泛的研究,其可以自动挖掘图像特征,减少了大量手工提取图像特征的工作。虽然该领域得到快速发展,但目前仍然有一些重要的问题还未解决。大
为获得草莓品种‘小白’的脱毒原原种苗并进行组培快繁,本试验研究了不同低温预处理时间、激素种类和配比对草莓花药愈伤组织诱导、不同激素种类和配比对草莓花药愈伤组织分化以及对草莓不定芽增殖和生根的影响。结果表明,‘小白’草莓花药在4℃低温预处理24 h、MS+6-BA2.0mg/L+KT2.0mg/L+IAA4.0mg/L培养基中诱导率最高,达到75.33%;最佳愈伤组织分化和再生芽增殖培养基均为MS+
《中国英语能力等级量表》(以下称为《量表》)规定了中国英语学习者和使用者的英语能力等级,描述了各等级的能力表现特征,是我国首个统一的外语能力等级量表,自发布以来就被广泛应用于英语测评、教学和学习中。然而,由于《量表》发布时间较短,其效度问题仍广受关注。由此,关于《量表》各分表的效度验证研究层出不穷,其中关于口译能力分量表的效度验证研究仍较少。本研究以Kane的分数解释和使用理论以及Toulmin的