数据挖掘技术的研究及应用

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:xuming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经济、商业、自然科学和社会科学等领域,很多数据是以时间序列的形式出现的。时间序列数据库描述、存储时间序列数据并提供各种查询操作,通常这些操作都是基于序列元素的值或者时间坐标进行的,无法实现对序列数据库中所蕴含知识的查询。把数据挖掘技术应用于时间序列数据库能够发现时间序列数据库中所蕴涵的模式,进而扩展时间序列数据库的查询能力。 时间序列挖掘包括规则发现、周期模式挖掘、序列模式挖掘和相似性查询,其中,时间序列的相似性查询是时间序列挖掘的一个重要方面。本文研究了基于序列变化模式的相似性查询方法,包括序列变化模式的表示、全序列查询、子序列查询、序列数据的聚类以及基于簇的序列查询,提出了完整的基于序列变换模式的相似性查询方法,主要的研究内容和研究成果如下: 1.提出了基于序列变化模式的子段表示方法。该方法以指定区间内的显著点作为子段的端点,通过指定显著性区间的大小,用户能够直观地控制序列的划分粒度,实现对序列数据库相同粒度的子段划分。该方法具有较好的稳定性和一致性。 2.为了度量序列模式的相似性,定义了顺序映射来描述序列变化模式之间的对齐,将序列映射路径上的模糊相似性距离作为两个序列之间的相似性度量。该距离与序列的长度无关,能够消除序列变化模式在时间轴上的差异对相似性度量的影响,更好地表示序列之间的相似性。 3.提出了基于抽样过滤的全序列查询方法。在保持序列变化模式的前提下,使用抽样点来计算序列之间的DTW距离,并依据抽样比率和查询参数选择过滤距离对序列数据库进行过滤,实验结果表明,抽样过滤的方法明显提高了查询效率。 4.提出了基于模式的子序列查询方法。通过将序列变换为相对序列,实现了对序列中任意位置、任意长度子序列的规范化;为了提高查询效率,将相对序列的特征向量进行离散化分类,并使用后缀树进行索引。该方法能够对不同取值范围、不同长度的子序列进行有效的查询,实现了对序列数据库在不同划分粒度下的模式查询。 5.给出了基于相似性距离的序列聚类方法。该方法在聚类过程中使用相对 西北工业大学博士学位论文 距离以消除簇的分布特征对聚类的影响,实现了正确的聚类次序。在聚 类的厂始阶段,使用随机选取的种于点对簇进行初始化,减少了层次聚 类初始簇的数目,提高了聚类效率。聚类结束后,使用簇的内聚性和相 异性对聚类的质量进行评估。 6.实现了基于簇的序列查询方法。根据序列数据库的聚类结果,将序列数 据库划分为若干层次的簇结构,通过对查询序列进行k-最邻近分类,确 定查询序列所属的簇,然后在相应的簇中执行相似性查询,实验结果表’ 明,基于簇的查询显著提高了查询效率。 7.设计并实现了时间序列查询的原型系统,对上述方法进行了验证。
其他文献
为了评估网络信息系统的安全风险,提出了一个由风险网络和风险传播算法构成的风险传播模型,并以一个具有代表性的实例阐明了该模型在网络风险评估中的应用,验证了传播算法的正确
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
随着信息化社会的不断发展,信息安全成为社会关注的热点,基于生物特征的身份识别在社会生活中的需求越来越强烈。近年开展的生物特征识别研究工作已经表明,单一模态的生物特
[摘 要]人民币汇率的变动对中美的贸易收支究竟能产生多大的影响,人民币升值是否能成为削减中美贸易顺差的有效手段?如果人民币汇率不是造成中美贸易顺差的主要原因,那巨额的中美贸易顺差又是如何产生的?本文通过对中美双边外部实际汇率和中美贸易顺差等要素进行实证分析,发现汇率问题并不是造成中美贸易顺差的主要原因。根据实证分析的结论,在研究的基础上,探寻中美贸易顺差背后的真正原因和实质。  [关键词] 人民币
慢性呼吸道疾病已成为一种易发、高发,而又往往被人们所忽视的慢性疾病。常见的慢性呼吸道疾病包括慢支气管炎、肺气扩、支气管哮、肺结核、肺癌等。由于病理研究对慢性呼吸
[摘要] 利率互换常作为债务保值工具,用于管理中长期利率风险。我国利率互换业务虽然市场的发展仍需要继续完善,但对价格发现和评估流动性状态的作用,已相当显著。本文通过对互换利率和国债收益率进行格兰杰因果检验来验证两个序列是否存在领先落后关系,从而来检验互换利率的变化是否领先于市场基准利率的变化,进而验证利率互换市场的价格发现功能。  [关键词] 利率互换价格发现格兰杰因果检验    一、引言  20