基于时空感知的跨社交网络用户识别算法的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:jonelove0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展以及移动智能设备的普及,使社交网络成为信息社会不可或缺的社交手段,针对社交网络的研究已成为学术界和互联网企业的研究热点。在现实生活中同一个自然人拥有不同的社交网络的现象很普遍,通过跨网络的用户识别方法有效识别不同社交网络中的同一用户账户,对基于社交网络的分析和应用具有重要意义。近年来,研究者们提出了一些基于用户轨迹相似性的跨社交网络用户识别的新方法,但大多数识别方法没有考虑时间和空间的强关联特性,导致识别准确率不高。因此本文在考虑时间和空间强关联特性的基础上,设计了跨社交网络的用户识别模型,并实现了用户识别的相关算法UIDwST(User Identification based on Spatio-Temporal perception)。该模型首先对获取的原始数据进行预处理,解决了原始数据存在的噪声过多、缺失值及数据分散等问题。预处理包括对获取的字段进行清洗、抽取、对位置实体进行经纬度坐标的转化等。然后进行跨社交网络用户对轨迹相似性计算。完成了根据TFIDF算法思想,为不同的签到记录分配不同的权重的计算,以增强不同签到记录的辨识能力。以核密度估计方法为主结合SIGMOID函数设计了考虑时空强关联特性的用户对相似性计算方法。最后完成了跨社交网络用户识别。根据上述方法计算出的所有用户对的相似性值,按照相似度值从高到低进行排序,排序结果作为用户相似度判定的输入。建立了用户对判定原则对排好序的用户对进行过滤生成“候选用户对集合”。利用SIGMOID函数、ReLU(人工神经网络中常用的激活函数)和阶跃函数在对“候选用户对”进行判定,将相似度高于阈值的用户对判定为同一用户,最终得到跨网络的用户识别结果。本文分别在三个真实数据集上对设计的用户识别方法进行了实验和结果分析,实验结果表明该方法是可行的。随后和三个现有近似方法进行比对实验,实验结果表明,在三个真实数据集上该方法得到的准确率(Precision)分别达到了0.7847,0.8528和0.8594,高于对比实验的0.6984,0.8351和0.8580,在识别准确率上分别提升了8.63%,1.77%和0.14%。
其他文献
从壁厚、硬度、变形、无损检测等方面对一台缺水事故锅炉进行了检验与分析.
本文通过对珠海市垃圾发电厂一年多运行情况比较和分析,摸索出了垃圾焚烧炉稳定燃烧的技术。
结合CAD技术,采用Autolisp语言对工业锅炉进行结构设计计算,同时采用FOXBASE语言对相应的锅炉进行热力计算。设计计算信息以图形文件及数据库文件的形式存取,能直接形成热力计算书并为工业CAD成图提供
<正> 众所周知,应用锅炉供热是需建造锅炉房的。但锅炉是压力容器,其制造、安装、运行都要接受当地劳动部门的安全监督,而且在房屋密集的现代化大都市里,又很难建造符合安全
某锅炉水冷壁管在运行过程中发生爆管,通过宏观、微观金相检验和X射线物相分析等检测方法,对其进行了分析。结果表明,爆管系水质管理不当而产生严重水垢,使水冷壁管局部长期超温,
该文介绍了修正威尔逊法的原理及其在管壳式换热器传热性能试验中的应用,并讨论了该方法的应用条件。
分析了螺纹烟管产生高温腐蚀导致烟管泄漏的原因,提出了治理及预防措施。
对常压燃油(气)锅炉的腐蚀进行检验和分析,提出处理意见,确保锅炉经济安全地运行。
分析了重油加热、雾化及燃烧过程中易出现的问题,并提出了解决措施。
目前,中国已成为全球最大的新车市场,随着国内市场的不断增大,国家对环保问题愈发重视,法规对油耗、排放等要求也越来越严格,并大力发展新能源汽车。在激烈竞争的市场环境下,传统动力的开发产品要做到抢占现有市场,就要缩短开发周期并严控进度计划。对于发动机开发项目,由于其技术复杂度高,一旦在开发过程中出现重大问题,很可能导致项目延迟,因此,在项目开发过程中如何预防重大质量问题以及发生问题后如何快速有效解决,