【摘 要】
:
伴随信息革命的飞速发展,人类社会发展进程与速度正在被深刻影响,人们的生产生活方式正在被全面改变,人们的生活已经被在线社交媒体全面占据。然而,信息传播的便捷和低成本导致社交媒体上充斥着大量的谣言信息。谣言的泛滥影响了人们的日常生活,损害了社交媒体平台的公信度,造成了社会秩序的慌乱。如今,谣言泛滥造成的社会影响以及谣言检测的研究价值也引起了学术界的高度重视。尽管近几年谣言检测技术已经取得突破性进展,但
论文部分内容阅读
伴随信息革命的飞速发展,人类社会发展进程与速度正在被深刻影响,人们的生产生活方式正在被全面改变,人们的生活已经被在线社交媒体全面占据。然而,信息传播的便捷和低成本导致社交媒体上充斥着大量的谣言信息。谣言的泛滥影响了人们的日常生活,损害了社交媒体平台的公信度,造成了社会秩序的慌乱。如今,谣言泛滥造成的社会影响以及谣言检测的研究价值也引起了学术界的高度重视。尽管近几年谣言检测技术已经取得突破性进展,但是在谣言检测领域仍然存在诸多挑战。首先是谣言检测领域现存的研究数据数据体量小,数据老旧过时,已经无法满足现有的谣言检测研究。其次,目前的谣言检测方法对于现有数据的利用效率低,不能充分挖掘现存数据的最大价值。最后,谣言检测领域对于无监督方法的研究较少,效果较差,因此如何提升无监督谣言检测方法的效果也是一个值得研究的问题。针对以上难点,本文分别展开了研究,并取得以下几点研究结果:1.构建中文微博谣言数据集:本文收集来自中文社交媒体平台——“微博”上的谣言和非谣言数据,构建了一个最新的中文微博谣言数据集(Chinese Weibo Rumor Dataset(CWRD))。该数据集包含26176条谣言微博和35429条非谣言微博,总共包含61605条微博。在此基础上,本文后续的谣言检测工作均在该数据集上展开实验研究。2.基于数据增强和用户建模的有监督算法:本文提出了一个基于数据增强和用户建模的有监督谣言检测算法。本文使用通过基于词语替换的增强、基于回译的增强以及基于相似句生成模型的增强三种增强方法,生成了不同的增强数据。与此同时,针对谣言本身数据的特性,本文对用户的信息进行建模,然后将谣言的文本信息和用户的建模信息融合。实验证明该方法有效提升了谣言检测模型的检测效果以及增强了模型的泛化性和鲁棒性。3.基于对比学习的无监督聚类算法:本文对于谣言检测在无监督领域的研究进行了创造性的探索,并且提出了一种新的端到端的无监督谣言检测聚类算法。该算法基于对比学习的基本思想,利用文本数据增强构建对比学习所需的正负样本对,利用对比学习优化谣言文本的表征向量。然后,通过联合训练对比学习和聚类学习,达到更强的无监督谣言检测效果。通过实验证明,本文提出的无监督谣言检测方法达到了更好的效果。
其他文献
锂离子电池是近30年来最重要的发明之一,它具有能量密度高、无记忆效应、循环寿命长等优点。然而,锂离子电池在储存、运输和使用的过程中往往并非单一存在,而是以水平或竖直方向排列的电池组的形式出现。当电池组中某一单体电池受到高温、高压、过充或过放等外界刺激时,可能会在模组内引发热失控传播的危险事故。因此,对电池的热失控传播情况进行研究,从而了解热失控传播的热量传递特性,有助于保障锂离子电池组的热安全。对
神经网络剪枝是神经网络模型压缩的常用方法之一,剪枝算法通过移除网络中的冗余权重实现模型压缩。通道粒度是神经网络剪枝粒度之一,通道级剪枝算法将每个滤波器中的权重作为整体进行移除,减少了卷积神经网络中的通道数量,降低了权重与输入特征图的计算复杂性。由于通道级剪枝保留了矩阵运算的结构化特性,使用通用软硬件,即可实现推理加速,因此通道级剪枝算法广泛用于卷积神经网络的模型压缩场景。绝大多数的神经网络剪枝方法
目的 探讨基于家庭赋权的护理干预结合个体化饮食结构调整在尿毒症维持性血液透析患者中的应用效果。方法采用随机数字表法将80例尿毒症维持性血液透析患者分为对照组与观察组,各40例。对照组采用常规护理干预,观察组在对照组基础上加用基于家庭赋权的护理干预结合个体化饮食结构调整。比较两组的干预效果。结果 干预后,观察组的白蛋白(ALB)、前白蛋白(PA)、血清铁蛋白(SF)水平均高于对照组,心境状态量表(P
随着视频业务的兴起,移动流量需求飞速增长,无线通信系统需要实现千倍的网络容量增长。为了实现上述目标,许多先进技术如大规模输入输出(Mas-sive Multiple-Input Multiple-Output,massive MIMO)、毫米波(Millimeter Wave,mmWave)等得到了广泛研究。然而,高频的mmWave信号路损值极大,极易被障碍物阻挡;massive MIMO配备了大
目的:1.通过蒙医针刺疗法对更年期综合征血清E2的影响研究来评价蒙医针刺疗法对更年期综合征的临床疗效,为临床上治疗更年期综合征提供参考。2.为防止更年期综合征进一步加重或并发其他疾病,提供非药物治疗的传统治疗方法。方法:从2020年12月至2022年01月就诊于内蒙古民族大学附属医院治未病科及妇科的45-55岁女性更年期综合征患者中筛选60名患者,将其随机分为对照组和治疗组,每组患者30名。对照组
大数据时代,数据规模和维度与日俱增,对于高维大数据,如何以更低的计算成本估计数据集之间的距离、快速判断数据集之间的关系,进而帮助用户合理地做决策,具有重要的研究意义和广泛的应用场景。例如,在迁移学习中,选择和目标数据集之间距离小的数据集作为源数据集,可以有效地提升学习效果、节约计算成本。最优传输(Optimal Transport)是一种衡量分布之间距离的模型,因此,本文采用Earth Mover
目的:蒙药哈日阿布日-16治疗慢性阻塞性肺疾病(敖西根阿日哈嘎巴达干盛型)的临床疗效观察及探索在分子生物学水平的作用机理。方法:收集2020年12-2021年12月期间在内蒙古民族大学附属医院蒙医呼吸科就诊的符合纳入标准的慢性阻塞性肺疾病(敖西根阿日哈嘎巴达干盛型)患者30例,作为研究对象,治疗方案:早晨:哈日阿布日-16,3g,晚上:哈日阿布日-6,3g。治疗一周,评估患者治疗前后临床疗效评价、
目的:本论文通过问卷调查和田野调查,了解赤峰市蒙古族旗县缺血性脑卒中二级预防的现状,分析其赤峰市蒙古族旗县缺血性脑卒中二级预防的主要影响因素并提出相应对策,为赤峰市蒙古族旗县群体提高缺血性脑卒中二级预防疗效提供参考。方法:以缺血性脑卒中二级预防指南为框架,经脑血管病专家咨询拟定问卷调查表。通过电子问卷调查的形式,对赤峰市蒙古族旗县的符合纳入标准的缺血性脑卒中患者,进行问卷调查。将数据用SPSS 2
目的 探讨颅内血肿相关手术操作编码,提高编码的准确性。方法 掌握颅内血肿相关临床知识,理清编码思路,结合具体案例分析颅内血肿相关手术操作编码。结果 颅内血肿经抽吸编码于01.09,颅内血肿经切开、环钻等方法需区分血肿部位,硬膜外血肿清除术编码于01.24,硬膜下血肿清除术编码于01.31,脑内血肿清除术编码于01.39,去骨瓣减压是手术步骤的时候省略编码。结论 临床医师规范手术名称书写,病案编码员
随着中国经济的快速发展和经济全球化水平的提升,中小企业由于行业竞争激烈、资金不足等问题,存在发展速度缓慢、营销策略不够完善、品牌建设缺乏策略等问题,中小企业面临着很大挑战。为了改变这一现状,中小企业应该积极地寻求整合营销传播策略。本文分析中小企业实施整合营销中的困境,提出整合营销传播的有效思路,以及如何运用整合营销传播来实现快速发展,最后对中小企业如何通过优化和提升自身在市场拓展方面所采取的措施进