【摘 要】
:
近些年来,随着移动互联网技术的发展,人的行为也逐渐开始往数字化方向发展,产生了大量的数据。数据挖掘可以从海量的数据中提取潜在知识,然而也可能侵犯个人隐私。区别于传统
论文部分内容阅读
近些年来,随着移动互联网技术的发展,人的行为也逐渐开始往数字化方向发展,产生了大量的数据。数据挖掘可以从海量的数据中提取潜在知识,然而也可能侵犯个人隐私。区别于传统的加解密方式,数据挖掘更多的是通过数据关联对用户安全造成影响,本课题通过以数据挖掘获取用户敏感信息的方式,来分析数据挖掘对用户安全带来的潜在危害。首先提出了一种基于用户行为习惯的流量分类系统,该系统首先采集广泛暴露在互联网环境中的网络流量数据,从中提取用户上网流量中的基本协议数据,进行数据清洗和规约等操作,然后通过模式挖掘和关联规则学习等数据挖掘算法提取用户行为特征,建立用户的模式数据库,最后提出模式匹配算法,将未知样本流量中提取的模式与已知的模式库进行匹配从而实现分类;收集了足够的用户浅层信息后,开始针对两类用户敏感信息进行挖掘:预估用户消费情况和预测用户的行为序列。预估用户的消费情况是基于信息关联和统计分析,以及利用贝叶斯公式求得用户购买事件发生的概率,最终给出用户一段时间内总共的消费记录;预测用户行为序列是基于N元语法和马尔科夫预测模型,N元语法是用来将历史数据生成语料库,从而可以求得当前状态的条件转移概率,最终实现预测用户未来的行为序列。最后通过真实的用户上网流量数据进行试验,验证了分类模型和预测模型的有效性。通过成功获取用户部分敏感信息,论证了数据挖掘可以对用户安全造成的很大的影响,同样的方法还可以用来挖掘用户的性别,年龄,职业等。因此大数据环境下用户的隐私安全问题需要引起人们广泛的关注。
其他文献
通过分析世界航天产业的市场结构、竞争格局以及全球航天产业的发展趋势,提出我国航天企业的市场化发展思路。
宋代名臣诗人张守及其家族,在宋代政治史和社会文化史上均具有相当重要的研究价值,但是研究界似尚未对这一课题予以应有关注。本文爬梳史料,力图对张守及其家族事迹做一系统
"乡政村治"的治理格局,使我国乡村社会初步呈现出治理主体多元化的态势。多元化治理主体对乡村治理有利有弊,从乡村治理的现实状况考察,由于乡镇政府的治理不力、乡村非政府
分析了珠江口盆地西部文昌A凹陷构造演化、沉积体系及其对古近系天然气成藏组合时空分布的控制,认为珠海组二、三段(扇)三角洲及潮坪砂-断背斜是主要的天然气成藏组合,恩平组断陷
在《道德与法治》课堂教学中,教师以尊重本学科特点及教学基本规律为前提,科学创设传统文化主题情境,通过优化读、看、引、做等融入的方式和途径,让学生在饶有兴趣的探究中激
目的意义微波作为一种新的致伤因素已受到高度重视,随着微波技术的广泛应用,其损伤发生机制和有效的防护药物研究逐渐成为热点。中药具有几千年的药用历史,疗效可靠且毒副作
<正>1980年7月7日,中国第一档电视天气预报节目开播。1993年,经与中央电视台协商,并经财政部与物价局批准,气象节目可适当收费,成为中国气象电视服务可持续发展的基础。经过
地铁车辆段的室外综合管线设计是车辆段设计中的一部分,关系到整个车辆段的运作。室外综合管线通过三维设计可以更清楚地表示管线的空间位置,并且可以通过软件对管线系统进行
目的调查大连地区孕妇弓形虫感染情况.方法用酶联免疫吸附实验(ELISA),检测受试者血清中的特异性抗体IgG、IgM和循环抗原CAg.结果孕妇弓形虫IgG、IgM和CAg阳性率分别为23.66%
房树人绘画投射测验属于经典绘画投射测验,可以很好地激发来访者有意识和无意识的联想。中学阶段是个体生涯发展的重要时期,此时生涯规划教育需要带领学生去探索和看到自己最