【摘 要】
:
近年来,随着信息技术的飞速发展,各类机器与设备的高效化和智能化程度不断提高,人们的日常生活和工作中有越来越多的时间序列数据被采集下来。为了有效的挖掘和分析出这些数据隐藏的信息和潜在的价值,众多学者提出了许多针对性的方法。但是由于时间序列数据本身具有维度高和数据量大等特点,直接对其进行分析和挖掘的计算复杂度较高,效率较低,所以时间序列数据通常需要进行降维处理。传统降维方法难以有效捕捉时序数据的形态特
论文部分内容阅读
近年来,随着信息技术的飞速发展,各类机器与设备的高效化和智能化程度不断提高,人们的日常生活和工作中有越来越多的时间序列数据被采集下来。为了有效的挖掘和分析出这些数据隐藏的信息和潜在的价值,众多学者提出了许多针对性的方法。但是由于时间序列数据本身具有维度高和数据量大等特点,直接对其进行分析和挖掘的计算复杂度较高,效率较低,所以时间序列数据通常需要进行降维处理。传统降维方法难以有效捕捉时序数据的形态特征。为解决这一问题,本文提出一种融合波动率的时间序列符号聚合近似方法,并将其应用于时序数据分类和故障诊断问题中,主要研究内容如下:(1)融合波动率的时间序列符号聚合近似表示:本文在传统符号化方法的基础上定义波动率指标来同时量化时间序列的波动幅度和变化趋势信息,以此来弥补时间序列数据降维之后的信息丢失问题;然后用融合波动率的符号矢量近似刻画子序列。(2)时间序列相似度计算与分类:在融合波动率的时间序列符号聚合近似的基础上给出一种新的时间序列距离度量方法。以此度量方法为基础,提出了时间序列的相似性计算和分类方法,并在20组UCR时间序列分类档案库中的数据集上进行了分类学习实验,验证所提方法的有效性。(3)时间序列符号聚合近似与故障诊断:在凯斯西储大学的轴承故障数据集上,结合CNN和LSTM的优越性,本文提出了轴承故障诊断模型。在融合波动率的时间序列符号聚合近似方法基础上,将原始时间序列转换为波动率序列和符号均值序列,然后把这两种序列分别依次对应输入到CNN模块和LSTM模块,以此来诊断轴承故障。结合UCR时间序列分类档案库和凯斯西储大学(CWRU)的滚动轴承故障诊断数据对所提的方案进行实验评估。从实验结果来看融合波动率的时间序列符号聚合近似方法在绝大部分数据集上获得了较传统符号聚合近似方法更好的分类准确率和时间效率。在故障诊断方面,使用融合波动率的时间序列符号聚合近似的改进方法对原始数据降维之后的诊断准确率虽然略有降低,但是时间效率却有很大的提高。
其他文献
高压基性麻粒岩是造山带常见的高级变质岩,多形成于从俯冲到碰撞的汇聚环境中,常常保留了丰富的矿物组合和变质结构信息,对高压基性麻粒岩变质作用的研究可以为我们理解深部地壳俯冲碰撞的构造演化过程提供重要的线索。在华北中部造山带北部宣化地区出露了大量的高压基性麻粒岩,宣化西望山地区高压基性麻粒岩的变质作用研究,对于了解华北中部造山带前寒武纪变质基底的构造与演化历史具有重要意义。本文通过详细的岩相学与矿物化
在浮选过程中,起泡剂对泡沫性质有决定性影响,进而影响分选效率。将两种或两种以上起泡剂组合,产生协同效应,是提高浮选效果的有效方式。我国铅锌矿资源逐渐贫细杂化,需要优
互联网技术和网络终端的普及使得虚拟社交网络越来越深远地影响着公众生活的各个层面,如目前十分流行的社交网络平台有新浪微博平台、腾讯微博平台、facebook、twitter等等。
新媒体自出现以来,已逐渐成为人们日常生活中不可或缺的部分。以各种应用软件为基础的新媒体,为人们认识世界,了解世界以及开展社交提供了平台。新媒体自身的特点及其庞大的
天然酶是一种高效的生物催化剂,它们几乎参与维持生命的所有代谢过程。由于天然酶的高催化活性和底物特异性,它们还被广泛用于环境保护、食品工业和生物医学等领域,但是由于其蛋白质特性,天然酶通常具有稳定性低、催化活性容易受环境影响、纯化困难和成本高等缺点,这些缺点严重阻碍了人们对它们功能的研究,并且限制了它们的实际应用。为了克服天然酶的这些缺点,研究人员长期致力于人工模拟酶的探索。目前随着生物学和纳米技术
随着管理学的不断发展,绩效管理的重要性愈加显著。当企业进入发展缓和期,无法快速抢占市场份额时,企业的绩效管理水平就决定了企业的盈利水平。AC公司正是一家业务增长缓慢
根据国际能源署统计,中国在2007年开始超越美国成为第一大碳排放国,而我国碳排放主要驱动力是城镇化和对外贸易。在城镇化过程中,人口城镇化对碳排放的影响越来越不可忽视,对
“大众创业、万众创新”已经被政府定位为中国经济继续前行的“双引擎”之一,创业型经济的巨大推动力已有目共睹,因此,促进以创业企业为中心的创业生态系统健康可持续发展,对
互联网技术迅猛发展促进了股权众筹的兴起,便捷了中小微企业的直接融资。然而这一新型产业在我国的成长与发展却仅有两年。在当前传统法律框架下,我国立法机关不得不选择以私