基于群体智慧的社交网络数据挖掘的研究

来源 :贵州大学 | 被引量 : 2次 | 上传用户:sgb158518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在各种社交媒体中,以微博为代表的新应用不断出现打破了传统的信息传递与沟通以及人际交往模式,社交网络成为人们获取信息和分享信息的重要平台。随着社交网络的发展,每天有大量的信息在网络上产生和传播,未经核实的信息的传播潜在着很大的问题,有碍社交网络环境的健康发展。为了保持社交网络的良性发展,树立正确舆论、分辨并遏制谣言传播显得尤为重要。对社交网络进行研究,在揭示社交网络信息传播规律、信息过滤、谣言预警及控制方面有着重要的实践意义。以往的社交网络研究很少对弱关系进行分析,但是弱关系极大地影响着信息的传播,在确定社交网络关系的基础上,社交网络研究才有充分的依据。对社交网络谣言进行排名研究,有助于区别活跃度高的谣言与非活跃的谣言,从而降低谣言检测的成本。而在谣言检测中,蚁群算法虽然能够提高谣言分类的准确性,但蚁群算法是全局最优算法,效率较低,结合随机森林进行特征选择,能弥补这一缺陷。因此,本文主要围绕社交网络关系分析、微博谣言排名、微博特征分析及谣言检测三方面进行深入研究。论文完成的主要工作包括:研究了新浪微博数据采集与预处理技术,针对数据挖掘相关研究对微博数据样本的要求,提出了数据爬取、数据预处理方案;针对社交网络中特定社交群体,对弱关系社交网络进行研究,给出了弱关系强化的条件;在社交网络关系研究的基础上,通过分析谣言与非谣言用户的贡献度、各因素对谣言排名的影响,在排名算法与加权算法的基础上,给出了微博谣言排名算法。在对微博数据进行初步分析后,针对特征选取、微博谣言检测准确率不高的问题,在用户、文本、传播三个方面做特征选取,结合群体智慧,给出基于蚁群与随机森林的混合特征选择算法,并将算法应用到新浪微博谣言数据分类中。针对算法的准确率及召回率进行对比分析,实验结果表明改进后的算法提高了谣言检测准确率。
其他文献
PVC给排水元件注塑制品的表面缺陷严重影响制品的表观质量和内在质量.本文对实际生产中遇到的表面缺陷问题进行分析,提出进行工艺调整、选择给水三通浇口位置、设计顶杆位置
为了更好地促进变电站巡检机器人在变电站中的应用推广,推进变电站无人值守进程,在详细分析了变电站设备巡检的现场需求基础上,提出了一种变电站设备巡检机器人分层混合式体
随着经济全球化的程度不断地加深,我国对外贸易也越来越频繁。电子商务的发展对外贸人才的需求量也大大增加。为了应对当前局面,我国必须培养培养更加专业与优质化的贸易人才
自20世纪50年代以来,美国空军一直致力于先进航空液压油的研究。从石油基型到磷酸酯型,再到聚α-烯烃(PAO)合成烃型,耐燃性的提高一直是促进新型航空液压油发展的主要驱动力。此外
随着经济的发展,人民生活水平的提高,对肉鸡的需求量逐渐增大。肉鸡养殖企业的经营要向专业化发展,其中加强会计的核算尤为重要。下文将会从肉鸡养殖企业的资产特点以及相对
文章根据从设计反馈中得到的信息分析选材的重要性,并从多个方面阐述由材料引发的一些风险问题,由此提出几点解决方案。
针对转炉烟气除尘和污水处理的现状,本论文详细探讨了转炉烟气除尘污水处理的工艺技术问题,首先简单分析了当前烟气除尘污水处理的方法设备及其存在的问题,在此基础上重点结
详细介绍了我公司尿素装置高压合成回路中调节阀在使用过程中所出现的故障现象,分析了故障产生的原因,并针对这些问题进行技术改造,改造后保证了尿素装置的长周期运行.