共现行为的周期性探测与研究

来源 :太原理工大学 | 被引量 : 2次 | 上传用户:axjlzpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的普及以及存储技术的发展,经常会遇到海量的结构复杂的数据需要分析,如微博信息数据、生物学数据、电子商务数据和移动信息数据等等,这些数据都可以用树结构或图结构来表示,并且在时间序列上是连续的。如何对这些时间序列数据进行挖掘,从中提取出我们需要的信息,已经成为数据挖掘研究领域的热点。不过目前的时间序列数据挖掘技术还处于起步阶段,挖掘算法有待补充和完善。在现实应用中,时间序列上周期性更为常见,更加具有研究价值和意义,是时间序列数据挖掘的研究热点。现实生活中,经常会有一些人周期性的共同做一些事情,如:每天早晨固定的一些老年人在广场锻炼,基督教徒每周日去教堂做礼拜等。这些周期性共同出现的人,很有可能由不认识的人变为好友。我们挖掘出这些人,在好友关系发现上可以做一些预测。再比如,某个家庭主妇每隔固定时间逛一次超市买一些生活消耗品(如肥皂、油、米、面等),我们挖掘出周期性共同购买的产品后,可以进行商品推荐服务。所以,本文就选择了时间序列周期模式挖掘为主要研究对象。本文首先介绍了时间序列数据挖掘的研究现状,然后对现有的时间序列周期模式挖掘算法进行了详细的分析。目前,大多数的研究都是对全局周期模式挖掘的研究,有很多有用的周期模式仅发生在时间序列的某个局部时间段上,现有的算法不能挖掘出这样在某个时间段频繁发生的周期模式。在分析了Aprior算法、类Aprior算法以及最大子模式命中算法后。发现最大子模式命中算法相对于类Apriori算法在挖掘的效率上有了明显提高,但仍需要对时间序列的数据库扫描两次,并且都要对模式进行频繁计数等工作。针对以上不足,本文提出一种基于更新模式树的周期模式挖掘算法,该算法能够全部实现前人算法的功能,并拥有更大的优势:能够挖掘出只在局部频发出现的周期模式;能够同时进行多个周期模式的挖掘等。并且在扫描数据库的次数上,只用扫描一次,大大的提高了算法效率。又因为只扫描一次数据库,在数据的输入形式上,能够支持动态输入数据。最后,在算法应用方面本文也进行了一定的研究,在研究人们共现行为的周期性上进行了初步的探索。对斯坦福大学公开的亚马逊网站购物数据、基于位置的社交网站Gowalla的移动数据进行了分析。
其他文献
随着无线通信技术步入3G/4G时代,人们对广覆盖、高带宽的无线通信网络的需求越来越迫切,特别是当前越来越多的数据服务发生在室内环境下,室内无线网络覆盖变得非常重要。但是
随着无线AdHoc网络的广泛应用和复杂多媒体应用的不断流行,无线AdHoc网络的业务量陡然剧增。如何把有限的无线资源,以合理的方式分配给不同的用户或应用,以满足他们各自对无线资
随着科学技术的高速发展,人们获取数据的渠道越来越多,数据维数也急剧膨胀,如何对这些海量数据进行维数约简,从中提取对人们有用的信息,成为模式识别及机器学习等领域的关注重点。
无线传感器网络的MAC协议工作在网络协议底层,它决定了无线信道的分配和接入方式,对网络的性能有重要的影响,因而在无线传感器网络的研究中备受关注。现有的大部分MAC协议,通常把
大型系统的设计应该采用形式化(Formal Methods)的方法。形式化方法是建立在严格数学基础上,具有精确数学语义的开发方法。形式化技术具有改善系统开发质量和提高工程效率的
地震是地壳快速释放能量造成震动,期间产生震动波的一种自然现象。每年全球会发生约550万次地震,地震的发生往往会造成严重的人员伤亡和财产损失。我国是一个地震多发的国家,
在软件生命周期过程中,软件测试是保证软件质量的关键环节之一。随着分布式系统的不断发展,网络并发软件的测试方法受到了广泛关注与讨论。由于并发实体之间存在着复杂的交互行
随着网络的不断发展,人们在各方面对网络的依赖性逐步增加。现在,以网络为平台的网上购物、网上银行、网上金融交易等迅速盛行,但是消费者也必须对相应的安全问题提高警惕,账
耳语音是人与人之间一种特殊的语音交流方式。其具有声带不振动、基频缺失和声音能量低的特性,这些特性降低了耳语音的可懂度和清晰度。耳语音向正常音的转换重建具有重要的
无线传感器网络由许多体积小、价格低、处理能力强的传感器节点构成,集成了传感器、嵌入式、无线通信及分布式处理等技术,其已在军事、环境、家庭等领域得到广泛的应用。基于无