时间序列数据挖掘研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:jiacktalk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与信息技术的普及和大容量存储技术的发展,人们在日常事务处理和科学研究中逐渐积累了大量宝贵数据,这些数据背后蕴藏着对决策有重要参考价值的消息。如何从这些历史数据中提取需要的信息正成为数据挖掘领域关注的热点。在现实生活中,时间是数据本身固有的因素,在数据中常常会发现时序语义问题。时序数据的出现使得有必要在数据挖掘中考虑时间因素。时序数据在现实生活中广泛存在,如金融市场、工业过程、科学试验、医疗、气象、水文、生物信息等,而且存储规模呈现爆炸式增长。因此对时间序列数据挖掘问题进行深入研究是非常必要和富有挑战性的。从20世纪末开始,复杂网络的研究已经渗透到生命科学、数理学科和工程学科、社会科学等众多不同的领域。对复杂网络的研究,已成为科学研究中的一个极其重要的富有挑战性的课题。其研究热点之一是寻找复杂网络中的社团结构,事实上这个过程就是一个聚类的过程,所以研究复杂网络社团划分新算法,对于时间序列聚类具有重要意义。本文结合时间序列数据挖掘和复杂网络理论,开展了如下的研究工作:综述了时间序列数据挖掘和时间序列模式挖掘的研究现状,指出了研究的现实意义。介绍并分析了最具代表性的序列模式挖掘算法。然后在Chun-Hao Chen等人的基础上,将模糊频繁趋势挖掘转换为序列模式挖掘并利用序列模式挖掘中的GSP算法生成候选序列模式并进行剪枝,能够更有效减少候选序列模式数量,从而高效的挖掘模糊频繁趋势,提高算法的效率。通过实验验证了本文提出的算法能有效挖掘模糊频繁趋势。提出了一种快速寻找复杂网络中社团结构的新算法。首先通过寻找网络中度最大的节点和其邻居节点,构造出其相应的邻居矩阵和稠密集。然后重复这个过程,最后得到了网络的社团结构。由于算法仅仅涉及到局部信息,因此计算量较小。实验结果表明了算法的可行性。该方法还可用于研究时间序列聚类等数据挖掘领域中的其他问题。
其他文献
现代计算机技术的高速发展,使得在科学研究和社会生活的各个领域中积累了大量的数据,为将这些数据转换成有用的信息和知识,数据挖掘技术应运而生并得以迅速发展。但是存在一
网络系统日趋大型化、连续化、高速化和自动化,功能越来越多、结构也越来越复杂,其故障诊断与预测技术涉及到相互关联、相互制约的多个层次和众多因素,其中有很多因素对于系
随着经济全球化的发展,互联网为中小型企业的发展带来更广阔的市场前景。针对目前网购市场中的大量女性客户,本文设计并实现基于化妆品销售的中小型B2C商城系统,提供给客户一
自从20世纪80年代后期数据挖掘理论出现以来,数据挖掘技术有了突飞猛进的发展。随着数据量大量增加,数据挖掘技术变得越来越重要,从而引起了众多研究人员的兴趣,数据挖掘迅速
科学技术是极具传承性的事业,任何一个科技工作者要取得好的进展,都离不开前人或他人的经验和成果。近年来,随着计算机、生物、化学、医药等领域的研究成果发布周期越来越短,
随着Internet的快速发展,越来越多的人们在网络上搜索需要的信息。然而,在互联网上,几乎所有的网页都包含着与主题无关的噪音信息,比如广告条、导航栏等。它们严重影响着搜索
搜索引擎旨在帮助用户有效的获取信息。现有的搜索引擎,存在精度不高,查全率偏低的缺点,迫切需要新的搜索模型的出现,语义搜索就是尝试之一。   鉴于已有语义搜索模型存在的问
专家系统是人工智能中一个正在发展着的研究领域,虽然目前已经有许多专家系统相继问世,并在各自不同的领域中发挥着重要作用,取得了巨大的经济效益及社会效益,但无论是在理论
随着信息技术、计算技术的发展,计算模式正发生着深刻的变革,已经逐渐从传统分布式移动计算发展到普适计算模式。普适计算的本质特征是融合物理空间和信息空间,为人提供透明
随着互联网技术的飞速发展,网络应用十分广泛,已经渗透到了各行各业。网络在快捷、方便的带来大量信息的同时,也带来了诸多安全问题。其中木马技术由于远程控制性、隐蔽性等