【摘 要】
:
在关系网络的关系挖掘中,为了将大量复杂的人群归类,往往需要从关系网络中发现不同的群体,根据人的个体属性特征或社交账户相互关注特征做聚类分析是常用的解决方法。然而,在
论文部分内容阅读
在关系网络的关系挖掘中,为了将大量复杂的人群归类,往往需要从关系网络中发现不同的群体,根据人的个体属性特征或社交账户相互关注特征做聚类分析是常用的解决方法。然而,在公安情报场景下,人的行为特征是情报人员十分关注的信息,如何将人的行为特征进行量化聚类,从而发现行为特征相似的人群并将它们归类是实现有效聚类分析的新思路。在充分了解公安情报业务的前提下,提出了一种基于关键图谱的群体发现算法(KCD,KeyGraph-based Community Detection),找出潜在关联群体,为公安情报部门提供决策支持。KCD尝试从人的行为特征入手,通过建立关键图谱并利用图聚类算法来进行群体发现。KCD首先将人与人之间的多个维度的行为特征进行量化计算,并将多维行为特征的量化值融合,形成三元组“人-人-值”的共现度集合;然后读取共现度集合,过滤掉噪音数据,建立基于人行为特征的无向图;最后对无向图应用聚类算法SCAN找出多个不同的群体。为了处理超大规模图,对SCAN算法进行改进,得到的SparkSCAN算法不仅能够并行运行在Spark平台上,快速高效地完成图的聚类,而且能找出图的中心点和离群点,解决了公安情报场景中群体之间关键人物的挖掘问题。利用公安情报场景中脱敏后的行为数据进行实验,对KCD进行了数据分区和存储模型的性能对比测试、改进聚类算法的参数测试、SparkSCAN算法和SCAN算法的性能测试等。结果表明,KCD能够有效的解决公安情报部门遇到的对行为特征数据进行群体发现的问题,所采用的数据分区及半结构化的存储结构能够缩短共现度的计算时间,在公安情报场景中的行为数据集下,SparkSCAN算法比SCAN算法执行效率平均提升了约69.9%,能够有效处理大规模的无向图聚类问题,并且提升效果随着数据集规模的扩大更加明显。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
This paper presents a novel method for polarized antenna transmission utilizing a differential technique. The method uses a linear cross-polarized antenna, for
Evolution of economic thought propagated different theories to understand the money management and its subsequent measures so as to fill demand and supply. The
研究了一类具有数值界不确定性关联大系统的最优分散保成本控制。利用线性矩阵不等式(LMI),给出了状态反馈最优分散保成本控制律的存在条件,并将最优分散保成本控制器的设计归结
就图书馆工作实施有效沟通的重要性和需处理的几种关系问题进行了阐述,旨在搞好图书馆读者服务工作。
In this paper, we present a background and theory of the effect of Surface Acoustic Wave (SAW) Filter Module (SFM) in-band ripple on high data rate communicatio
国家烟草行业改革的深入推进给烟草专卖局带来了全新的经营理念,烟草行业人力资源培训需求急速膨胀,行业培训内容逐渐向创新开拓的方向发展,人力资源培训的效果对烟草行业的
为实现煤矿乏风瓦斯资源化利用,采用变压吸附技术,对变压吸附系统的可变试验参数进行了单因素试验及正交试验,分析了解吸压力、原料气浓度和吸附塔高径比等对甲烷富集效果的
目的:探讨脂肪酰胺水解酶(Fatty acid amide hydrolase,FAAH)m RNA和蛋白分别在METH依赖者的外周单个核细胞(PBMCs)和血浆的表达情况,FAAH 385 C/A(rs324420)多态性与甲基苯