一种用于微博谣言检测的半监督学习算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:hwniuniu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在微博谣言检测中,对微博谣言进行正确标注需要耗费大量的人力和时间,同时数据类别的不平衡也影响了微博谣言的正确识别。为了解决该问题,提出一种基于Co-Forest算法针对不平衡数据集的改进方法,利用SMOTE算法和分层抽样平衡数据分布,并通过代价敏感的加权投票法来提高对未标记样本预测的正确率。该方法只需要对少量训练数据实例进行谣言类别标注即可有效检测谣言。10组UCI测试数据和2组微博谣言的实证实验证明了算法有效性。
其他文献
针对路局现有GIS实施系统的缺点和局限,借鉴国外铁路地理信息系统建设的经验, RGIS路局试点工程的统一应用框架应包括统一的海量空间数据库管理方式、开放的分布式组件、GIS
根据摆式列车运行时车体发生倾摆的特征,采用多体系统动力学原理,建立2M2T的摆式动车组横向动力学仿真统一模型.通过变化导向机构参数可以得到径向转向架或常规转向架的仿真
为实现车载主机BTM和监控装置间的顺利通信,设计能把CAN和485总线协议相互转换的接口网桥.网桥以89C52单片机为核心,通过CAN控制器对BTM进行配置和监控,同时和监控装置保持通
以解编车流作业规则和系统资源限制为约束,构造不同目标函数下铁路枢纽编组站作业分工数学模型,给出折角车流理论最大值和最小值及相应编组站作业分工方式及车流条件.基于折
在高原冻土地区修建隧道是一项开拓性的工作,无经验可循.通过设立试验段,铁道部科教司在昆仑山隧道共组织开展了7项科学研究,是其中之一.该隧道2003年2月竣工,同年5月22日在2
世界铁路货运发展的方向是重载运输,其不仅代表了铁路货运领域的先进生产力,而且带来了高的劳动生产率和巨大经济效益。发展重载运输的国家已经遍及五大洲所有铁路大国。美国、
将谓词逻辑知识表达法与面向对象技术相结合,提出面向对象的类谓词逻辑知识表达模型.该模型用对象和信息表现问题中的事物及其关系;用类和继承来模拟人们的思维方式.模型中通
给出一种基于边折叠和二次误差测度的快速简便的算法来简化带属性的网格模型.该算法通过分别建立几何和颜色属性二次误差测度来计算几何和颜色属性误差,用几何与颜色属性误差
建立列车—轨道结构耦合系统有限元模型,将轨道不平顺作为列车—轨道结构耦合系统的激励源,对普通碎石道床轨道结构和浮置板式轨道结构的列车—轨道结构耦合系统动力学性能进