在线金融论坛恶意用户群组检测方法及应用

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:h4975915
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网的迅猛发展促进了信息技术与网络通信技术的发展。社会生活的高度信息化,使网络承载了蕴含价值的数据,拥有海量用户的社会化网络媒体,已经被组织和个人广泛地用来辅助决策。在线金融论坛上存在巨大的用户群与潜在的商机,使虚假意见和垃圾信息被广泛地制造和传播,该类危害的源头即恶意用户群组。针对以上问题,我们利用网页信息提取、数据存储、情感分析、网络关系建模、重叠社区检测等技术,来采集在线金融论坛用户行为数据、构建用户关系网络、对用户关系网络进行社区划分、检测恶意用户群组并评价检测结果。本文的主要工作如下:1.通过对在线金融论坛网站页面的研究,分析论坛用户行为,利用网页信息抽取技术采集论坛页面信息,匹配实验所需的用户行为数据,并存储到本地关系型数据库My SQL中。2.基于机器学习,对训练集进行分词、特征选取,选择合适的情感分类器,对用户评论内容的情感进行分类预测,依据预测分类结果,构建用户行为网络关系模型,并描述用户相似情感网络的相关全局性统计特征,得出相似情感网络既满足“小世界”特性,也满足无尺度特性。3.考虑到节点属性对数据结构的影响,结合节点拓扑结构和节点属性信息,提出一种基于节点拓扑结构和节点属性的重叠社区检测算法,对在线金融论坛用户关系网络和斯坦福大学的三个社交网络数据集进行重叠社区检测,并与常见的社区检测算法作比较,验证了本文提出算法的可行性与有效性。4.提出相应的社区检测的外部指标,综合这些外部指标检测股票论坛中的恶意用户群组,并结合具体案例分析。
其他文献
近年来,随着医学影像技术的发展,基于大脑神经影像对脑疾病进行分类与分析吸引了大量研究者的关注。从大脑的医学影像构建出的脑网络,可以使得研究者从网络的角度分析大脑的
学位
Hausdorff距离是匹配点特征的一种重要方法,在图像处理、天文、数学、网络应用、医学、经济预测等众多领域中有重要应用,特别是在图像处理的匹配识别中应用十分广泛。传统的H
无线传感器网络由于其广阔的应用前景,已成为计算机科学领域的一个活跃的研究分支。由于传感器节点的体积限制,节点通常采用能量有限的电池供电,而且由于传感器网络往往包含
生物识别技术以其无可辩驳的安全性、便利性、易操作性成为身份鉴别技术的热点。人体的生物特征包括指纹、声纹、人脸、虹膜、掌纹等等。相比其他生物特征识别技术,指纹识别
随着业务流程模型的广泛应用,其正确性显得尤为重要。时间约束决定了业务流程能否正确执行,任何一点时间延迟都有可能造成极大的资源浪费,所以对时间约束进行验证是检测业务
粗糙集理论在处理不完备、不精确、不一致等各种不确定数据方面具有明显优势,越来越多地被用来作为数据分析的工具。当前,随着海量动态数据的不断涌现,数据的不完备、动态变
随着复杂科学的研究成为学术研究的热点,与之相关的研究工作已经深入到了工程技术、社会、政治、医药、经济、管理等很多相关学科并广泛应用,元胞自动机已成为研究复杂系统的重
随着网络的普及和黑客攻击的增加,网络安全问题变得日益严重。入侵检测作为一种全新的安全手段,用于检测对电脑系统非预期的访问、控制和破坏尝试,可以使网络的安全性得到很
在国际图形学界,织物的模拟建模一直备受关注,成为计算机图形学的研究热点。其应用涉及计算机辅助设计与制造,虚拟手术,电子游戏,服装设计,虚拟现实等诸多领域。织物建模是织