面向大规模网络流量的用户数字身份关联

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qq251775522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的迅猛发展和快速普及,各式各样的在线业务已经成为了人们生活中必不可少的组成部分。通常情况下,人们拥有多个在线业务的账号,例如新浪微博、腾讯QQ、淘宝等。账号即为用户在网络上的数字身份。与此同时,用户产生的上网数据也在飞速地膨胀。因此,如何充分利用这些数据,以获得对每个用户更好、更深的理解,是目前最值得关注的问题。然而,在如此庞大的数据中,存在大量不完整或不一致的数据,导致用户的信息支离破碎。因此,连接同一用户在不同业务中的上网数据,将会使得用户行为分析以及用户画像更具完整性、一致性和连续性。本文的研究目标是找到一个适当的方法,用于关联同一个真实用户的所有数字身份。已有的针对用户身份关联方法的研究大多面向有限且相似的服务域展开,例如被研究最多的社交网络服务域。然而,为了尽可能完整地获得用户的全部信息,需要一个普适性更强的方法,可以不区分服务域地,将用户的所有数字身份关联起来。相比之下,本文的目标是解决最常见的情况,即做到跨服务域的数字身份关联。其中不同服务域的数据是单独生成的,并且在特征上有明显的差异。为了解决这一问题,本文提出了一种新的数字身份关联模型。从用户的上网行为信息例如设备指纹信息、时空行为信息等中,提取出重要特征,并利用监督学习的方法来训练模型,关联同一用户的不同数字身份。通过使用从中国北方某省收集的真实网络流量数据,本文对模型进行了评估,其精确率和召回率均达到了99%,说明了模型的有效性。模型的输入,即网络流量数据,覆盖了与互联网连接的用户的所有在线行为,这使得全网关联用户的数字身份成为可能。
其他文献
英国英语与美国英语的普通词汇中有相当一部分词的含义存在着差异,因而在表述同一事物时各自用不同的词。根柢欠深的英语学习者对此往往不甚了了,分辨不清,一旦同英、美人士
新闻价值观是人们在一定的认知基础上形成的观念系统。有什么样的新闻价值观就会有什么样的新闻价值标准。新闻从业人员在新闻制作中受新闻价值标准的制约,因此,人们经常使用新
网络环境鱼龙混杂,充斥着垃圾邮件和网络推广,这些行为损害了网络消费者的选择权,而垃圾邮件和商业推广也是商家侵犯网络消费者权利的集中体现。
提出一种无失真滤波器方法,并从理论上证明了这种方法的正确性,从而找一种既能抑制领道干扰,又能使受检信号不失真恢复的方法。解决了瞬态检测理论在实际应用中所遇到的关键问题
【正】 一、政府方面的组织机构在日本总理府里设有“老人对策室”,由日本各省,如厚生省、农林省、劳动省等部门组成。“老人对策室”由内阁总理大臣直辖,主要制定日本老年人
高等师范教育目的是为基础教育培养师资,这应该是非常明确的。然而,高师美术教育目的却模糊不清,究其原因,是我们对高师美术教育培养目标———中学美术教师的职业特征模糊不清。
目前,网络流量分类在网络管理和安全中发挥着很重要的作用。近年来,由于基于有效载荷和端口的方法的性能下降,使得基于机器学习(Machine Learning,ML)的方法变得越来越重要。
借助于互联网技术的发展,创造了一种全新的农产品销售模式即O2O(online to offline)模式,推动了农产品流通效率。通过对O2O模式的研究,指出其优劣势,为农产品业的发展提供建议,
性别自主决定权,指自然人享有的自由决定其性别的权利。性别自主决定权兼具人权和人格权的属性,它体现的是人性尊严和人格自由。自然人行使性别自主决定权受自身健康状况、年龄
大中型气田天然气封盖条件主要受盖层自身厚度和排替压力、气藏内部能量(压力系数)和天然气本身性质(流动粘度)的影响.气藏盖层封闭指标CSI值与天然气聚集效率为正比关系,CSI