【摘 要】
:
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中的垃圾信息,在给正常用户造成困扰的同时增加了网络负担,检测垃圾用户已成为网络空间安全领域关注的热点话题之一。因此针对目前垃圾用户检测的优缺点,提出基于符号网络的垃圾用户检测方法,主要工作如下:(1)首先对垃圾信息以及垃圾用户进行了分析,同时介绍了节点间距离度量的方法,并总结了文
论文部分内容阅读
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中的垃圾信息,在给正常用户造成困扰的同时增加了网络负担,检测垃圾用户已成为网络空间安全领域关注的热点话题之一。因此针对目前垃圾用户检测的优缺点,提出基于符号网络的垃圾用户检测方法,主要工作如下:(1)首先对垃圾信息以及垃圾用户进行了分析,同时介绍了节点间距离度量的方法,并总结了文本聚类的相关算法。详细介绍了文本聚类算法中的密度峰值聚类算法,并对符号网络的相关基础理论以及相关应用进行了阐述。(2)根据微博文本中关键词的语义特征提出了基于共邻居的文本密度峰值聚类模型。首先采用分词系统、TD-IDF、word2vector等技术实现文本向量化;然后,利用信息熵选取适量评论区内容来缓解文本稀疏性带来的类簇内相似性不高、类簇间差异不高的问题;其次,定义共邻居度量用户密度以反映用户真实的邻居数目;最后,在根据γ值完成初步聚类的基础上运用模块度增量,提高文本聚类准确率。在公共数据集以及爬取数据集上的实验结果表明,DPTCCN算法实现了文本聚类的自适应,且稳定性和准确率等方面较其他文本聚类算法效果更佳。(3)面对微博垃圾信息越来越隐藏化等问题,在对文本内容完成话题聚类的基础上,提出基于符号网络的垃圾用户检测模型。首先,在话题中定义话题距离和话题博文重复度作为检测中的一部分文本特征;其次,基于共邻居定义了综合考虑节点正链接和负链接邻居的节点间相似性,从而预测节点间存在链接的概率;第三定义节点正密度与网络正密度,进一步从局部与全局角度完成用户节点间符号的预测;最后综合考虑目标点与邻居节点的符号关系和链接概率识别目标点的类型,完成目标点用户类型的识别。实验结果表明,该算法可以有效的检测垃圾用户,在准确率与稳定性上都有较好的表现。
其他文献
如今全球糖尿病的人数越来越多,很多糖尿病并发症都会成为人眼失明的主要原因,如糖尿病视网膜病变(Diabetic Retinopathy,DR)、新生血管性青光眼(Neovascular Glaucoma,NVG)等,一旦疾病恶化到一定阶段,会对视力造成不可逆转的损伤甚至失明。目前对于眼底病变的诊断基本通过专业医生对眼底生理结构或病灶直接观察。这个过程费时费力,同时眼底图像病症复杂,各种病变程度存在
导热系数是材料的热物性参数之一,导热系数的准确测量有着非常重要的理论意义和使用价值。防护热板法是目前为止测量绝热导热材料导热系数最准确的绝对方法,但是近年来中国计量科学研究院开展的国内绝热材料导热系数测量的比对结果显示,不同实验室、不同来源的防护热板导热仪的测量偏差达到±15%。分析比对结果,认为产生测量差异较大的关键原因是导热仪的温度测量和控制水平不高,急需一种精确控温的方法和热控制系统,来提高
运动目标检测与跟踪技术是计算机视觉领域的一个重要研究课题,已经被广泛应用于安防、交通管理、机器人视觉。通过搭载视觉传感器获取视频图像信息,已成为移动机器人平台感知环境的重要方式。本文基于单目视觉研究NAO机器人运动目标检测与跟踪应用实现。由于实际应用场景复杂多变,现有的算法不能满足实际应用的需要。针对经典Camshift算法应用于机器人目标跟踪过程中遇到的问题,分别从目标检测和目标跟踪两个方面进行
在全球范围内,肺癌的死亡率居各种癌症之首。肺结节是肺癌早期的发病症状,准确检测与治疗肺结节对降低肺癌患者死亡率具有重要意义。目前,肺结节的筛查与诊断主要通过计算机断层扫描(CT)图像来实现。然而,肺结节在CT图像中尺寸不固定、形态多变,且易与肺内血管、器官等组织混淆粘连,因此,准确检测肺结节是一项十分困难的工作。随着深度学习在医学图像中的发展和应用,使人工智能技术辅助医生快速诊断肺结节已成为可能。
随着数据的爆炸式增长,越来越多人开始关注大数据问题。由于大数据具有规模大、维度高、数据复杂且变化速度快的特性,导致传统的机器学习算法不再适用。大数据约简是解决大数据问题的一种有效方法,大数据约简方法主要分为两类:样例约简和属性约简,也称为样例选择和特征选择。样例选择是从大规模数据集中选择出最有代表性的数据子集来代替原始数据集,特征选择是从高维的数据集中选择出重要的特征子集,并将原始数据投影到特征子
由于卫星具有强覆盖性以及可避免自然灾害的能力等优势,利用卫星通讯实现天地一体化通信网络系统是当下网络通信的发展方向。将地面网络与卫星网络进行无缝连接实现多种数据类型以及大容量信息数据传输是现在研究的热点。但是,地面通信环境与空间通信环境有很大的差异,因此地面网络的TCP/IP协议并不适用于空间通信,空间通信需要一种适合自身通信环境的协议。由于地面与空间通信网络的协议类型不同,要实现地面通信网络协议
随着深度学习的发展,图像生成技术有了长足的进展,研究人员提出了许多图像生成算法,但大多数图像生成算法只能生成单一图像,有些工作却需要图像对的数据集支撑。针对这一问题,本文重点研究生成图像对问题。图像对指的是主体高级特征相同,部分低级特征不同的对应图像元组,高效生成良好图像对可以更好地满足相关工作任务的需求。生成模型有多种,目前研究最多的是生成对抗网络和变分自编码器,本文主要研究变分自编码器的耦合模
软件定义网络(SDN)采用流量控制和转发分离的思想,具备网络可灵活配置的优势,迅速在数据中心网和企业WLAN网等小规模网络中得到了广泛应用。随着网络规模的增长,SDN网络中单一集中式控制器难以满足急速增加的流量需求,因此引入多控制器架构对网络流量进行管理和控制。但多控制器架构由于初期设计方式不合理以及实际运行中流量波动性较大等原因,容易出现负载不均衡的问题。针对此问题,本文从多控制器部署和交换机迁
电力电缆是电网正常运行的重要电力设备。在电缆及附件输电过程中,绝缘介质在直流电场长时间作用下,空间电荷积聚会造成绝缘介质产生局部放电场,进而引发局部放电。对电力电缆的局部放电进行实时监测可有效掌握电缆运行状态,是保证电网安全运行的基本要求。目前国内外研究人员针对电缆局部放电的检测提出了多种方法,但是针对长距离高压直流电缆局部放电检测研究还缺乏有效的实验手段。根据以上研究背景,基于萨格耐克(Sagn