多元时间序列中关联规则的发现——以股票为例

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tewy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘领域出现了很多有关时间数据的研究,时间序列分析是其中非常重要的一部分.这些数据可以很容易的从科学研究和金融领域得到.例如:每日气温、产品输出、基金和股票的价格等等.无疑,从这些序列中搜索有用的时序规则是非常有价值的.该论文从如下三个角度展开了讨论:●挖掘多元时间序列中相同采样点得到的观察值之间的关联规则(不考虑时间维的规则).关联分析方法可以挖掘事务数据库中"项"与"项"之间的规则.然而,时间序列的数据不是符号表示的事务数据,而是连续的数值数据.该文将时间序列变换到离散(符号)的事务数据后,使用关联分析方法,挖掘了多元时间序列在相同采样点得到的观察值之间的关联规则.这种方法在分析中国证券市场多元股票时间序列间的关联分析实验中,得出了满意的结果.●挖掘多元时间序列中不同采样点得到的观察值之间的关联规则(考虑时间维的规则).传统的关联规则分析方法只能分析同一事务中"项"与"项"之间的关系,却无法分析不同事务中各"项"的关系,这个弱点导致它不能分析不同时刻各时间序列观察值之间的关系.为了解决这个问题,该文提出了一种可以挖掘"跨事务"的关联规则算法:ES-Apriori,并用这种算法挖掘多元时间序列中不同采样点得到的观察值之间的关联规则.实验证明,这个算法效率很高.从实验得到的结果可以看到,发现的规则具有预测的意义.●挖掘多元时间序列中不同采样点得到的频繁片段模式间关联规则(考虑时间维的规则).时间序列的很多片段模式会频繁出现,分析它们之间的关联规则是非常有意义的.为了找到这些频繁模式,该文使用了基于"划分"的聚类方法,并使用动态时间规整(DTW)计算不同片段之间的相似度.我们将聚类后每个簇的中心作为频繁片段模板,并用它们匹配时间序列中与其相似的片段,经过这样的变换后,就可以分析多元时间序列不同采样点的频繁片段模式的关联规则.该文从多个角度挖掘了多元时间序列中的关联规则,着重讨论了具有"跨事务"性的关联规则分析方法,并且将这种分析方法的对象由"符号"扩展到了"模式".相应的算法在多策略数据挖掘平台MSMiner系统中得到了实现.
其他文献
云计算是当前流行的按需使用和付费的服务模式,它通过将服务器等物理资源虚拟化来动态地为用户提供各种各样的云服务。但是随着越来越多的商业服务被放置到云中,导致了云数据中
学位
随着“大数据”技术的飞速发展,数据成为当今社会生产生活中非常重要的资源,通过对大数据的快速处理,可以为社会带来巨大的经济效益。图像作为网络中传输最频繁的数据,如何对其进
本课题通过对Linux操作系统的研究与定制,最终研制出适合我国国情的、具备自主产权的海洋自动观测系统嵌入式Linux操作系统,该系统作为海洋自动观测系统应用软件的运行平台,
网络教育随着信息技术的发展。已经逐渐发展成为一种新的学习方式。网络学习打破空间、时间的限制,为需要学习的用户提供了一种获得知识、接收教育的新途径。网络教学为传统教
随着企业网的发展,需要在开放网络中不明身份的实体之间进行通信。为了在这种环境中提供机密性、认证、数字签名和完整性等服务,迫切需要在企业网中建立一个通用的安全基础机
该文在深刻分析现有招投标系统的基础上,主要研究如何提高电子招投标系统的公正性以及安全性.论文的第一部分为公正性研究,即匿名性研究,是利用基于椭圆曲线上ElGamal秘密系
协议是计算机网络的命脉,协议复杂性的提高导致协议工程学科的出现。协议工程的主要活动包括协议描述、验证、性能分析、自动实现和一致性测试,其中协议描述和分析是整个协议工
本文由项目开发中有关嵌入式Linux的移植工作,引出了关于研究与探索嵌入式Linux实时性问题的讨论。 本文首先介绍了嵌入式系统及其发展现状,阐述了项目设想和项目意义。接着
网络技术的发展为远程教育提供了一片崭新的天地,现代远程教学系统是一种以网络为基础的远程教育,它继承了传统远程教育方式中不受时间、空间和地点限制优点,学习者可以足不出产