基于趋势符号化的多元时间序列时态关联规则挖掘

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sz10088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂系统工艺连续、结构关系庞杂,在层次结构、时间过程和功能组成方面表现出非线性和不确定性,则难以建立能精确描述复杂系统的机理解析模型。此外,由于复杂系统的运行过程呈现出显著的时间特性,其运行监测参数是一类典型的多元时间序列数据。以基于数据驱动的控制思想为指导,将复杂系统运行工况转换为数据挖掘的问题,通过控制优化算法对过程数据进行分析,实现复杂系统的工况识别、故障检测和健康诊断。本文以此为切入点,重点关注时间序列的数据挖掘及相关算法,旨在发现对象发展的变化过程、变化趋势、变化规律等重要运行特征,充分考虑如何从多元时间序列数据中高效、准确地挖掘出系统运行过程中参数间隐藏的时态关联及趋势关系,主要研究多元时间序列数据的趋势特征提取和时态关联规则挖掘,其工作包括以下几个方面。为了挖掘多元时间序列中有用的时态关联规则,首先需要将时序数据转换为规则挖掘所需的符号序列。针对表征复杂系统运行工况的多元时间序列数据量大、维度高等特点,通过已有的符号化表示对数据进行压缩,并充分地考虑运行监测数据的趋势特征和时间序列数据的挖掘准确性等问题,提出了一种能够提取分段趋势的符号化表示方法。通过提取序列分段中的趋势变化,定义了三种基本趋势符号,分别表示“上升”、“下降”以及“平稳”的趋势特征,从而将其扩展至多级分段趋势表征中,并给出了趋势特征的距离度量计算方法。针对挖掘多元时间序列数据中具有时间特性的关联规则的效率提升问题。在经典的关联规则挖掘算法上进行改进,将时间区间内的事务数据库转换为布尔矩阵,进而利用布尔矩阵生成的频繁1-项集和频繁2-项集构建一种新的频繁项集树,找出其中所有的频繁项集,生成具有时间顺序的关联规则。该方法约束了序列的挖掘范围,减少了数据库的扫描次数,并且能够快速挖掘出频繁模式并存储相应的时态关系。此外,冗余规则的剪枝也有效地减少了系统资源的浪费,从而提高了算法运行效率。结合研究成果,将本文提出的研究算法应用于TE工业过程数据集,对数据进行趋势符号化表示,再基于趋势表示的符号序列采用改进的规则挖掘算法进行时态关联规则挖掘。并与同类方法进行实验对比分析,验证了本文研究算法对表征复杂系统运行工况数据的适用性,有效地提高规则挖掘的准确性和效率。
其他文献
超级电容器又称双电层电容器,介于电池和普通电容器之间的新型储能器件,具有充放电速度快、循环稳定性好、无污染和效率高等特点。电极材料影响是超级电容器性能优劣的关键性
计算器这种信息技术工具已经在中小学阶段基本上达到了普及,特别是课本教材加入使用计算器工具解决数学问题的知识点近些年逐渐明显增加。本文研究基于基本问题“计算器是怎
熔融沉积技术(FDM,Fused Deposition Modeling)作为快速成型技术(RP)中使用最广泛的技术。在实际生产中,力学性能可靠性作为衡量3D打印产品质量的一项重要指标,如何提高产品
本文主要介绍了铁离子螯合剂的研究进展。本论文改进了VLX600的合成路线。以邻甲苯胺为起始原料,经Sandermeyer靛红合成法合成7-甲基靛红(2),2在β-环糊精(β-CD)的催化下与氨基
在互联网+时代,网络已成为人们日常生活的常用信息获取渠道,网络上的多媒体数据呈现出爆炸式的增长,人们对信息的检索需求也日益增加,传统单一模式的多媒体检索已不能满足人
由于卫星技术的快速发展,高分辨率遥感图像的数据量增长迅速,光靠人工目视解译的方法效率较低、费时费力。随着时间的推移,地表物体会发生一系列改变,例如城市中的建筑物和道
宫颈癌不仅在女性生殖器官肿瘤中占首位,而且是女性各种恶性肿瘤中最常见的。通过早期的宫颈筛查工作,可以有效地降低女性患宫颈癌的风险,同时可以有针对性的对早期的宫颈病
在航空航天领域遥测系统承担着监测、传输和处理运载器运行状态和数据的职责,遥测数据为地面工作者提供运载器运行工况监测、安全评估的数据支撑,是保证运载器安全性、可靠性
兴隆台潜山带经历了多年勘探后,仍存在许多尚需深入探讨的关键问题,这些问题的解决必须建立在大量细致工作的基础上,结合近年来潜山油藏勘探开发比较成熟的新技术、新理论和
徐家围子火山岩勘探虽然取得了突破性进展,但由于每口井的火山岩岩石类型、储层发育特征存在明显差异,因此对其火山岩及储层的空间分布规律还难以掌握,急需对火山岩岩石类型