【摘 要】
:
多变量时间序列(MTS:multivariate time series)数据是多个变量在一段时间内按照一定时间间隔记录的观测值数据。MTS聚类可以在缺乏先验知识的情况下将样本划分成有意义的簇,是一种广泛应用于金融分析、流量预测、临床诊断等领域的关键技术。MTS具有模式复杂、时间顺序、变量之间存在相关性等特性,如何利用这些特性提升MTS聚类效果具有重大理论和应用价值。受图嵌入技术在各领域的优异表现
论文部分内容阅读
多变量时间序列(MTS:multivariate time series)数据是多个变量在一段时间内按照一定时间间隔记录的观测值数据。MTS聚类可以在缺乏先验知识的情况下将样本划分成有意义的簇,是一种广泛应用于金融分析、流量预测、临床诊断等领域的关键技术。MTS具有模式复杂、时间顺序、变量之间存在相关性等特性,如何利用这些特性提升MTS聚类效果具有重大理论和应用价值。受图嵌入技术在各领域的优异表现启发,本研究致力于挖掘MTS样本间邻域信息和MTS变量间相互关系,提出两种基于图嵌入的多变量时间序列聚类方法,主要研究工作如下:(1)针对MTS样本间潜在的邻域信息难以被发现的问题,提出一种基于图嵌入的多变量时间序列聚类算法(MTSC-GE)。MTSC-GE基于手工构建的图结构和图分析技术,通过对拓扑结构进行挖掘来发现MTS数据邻域结构的隐含模式。MTSC-GE首先将每一个MTS样本视作图的节点,构建MTS数据的图;然后通过保证MTS样本邻域的高阶相似度,将节点映射到低维空间的嵌入表示;最后根据获得的嵌入表示完成聚类。在多个公开数据集上的实验结果表明,相比基准方法MTSC-GE在准确率等评价指标上取得了优秀的聚类结果,表明了深度挖掘MTS样本之间潜在邻域信息进行聚类的有效性。(2)针对MTS变量间复杂的相互关系难以被捕捉的问题,提出一种基于多元高斯模型和图嵌入的多变量时间序列聚类算法(GM-DE)。GM-DE综合利用多元高斯模型浓度(精度)矩阵的稀疏性学习和协方差信息,捕捉和学习MTS数据变量间相关性,提高低维嵌入表示质量进而优化聚类结果。GM-DE首先使用多元高斯分布来拟合MTS数据,再计算高斯分布之间的Kullback-Leibler散度来构建图;其次,GM-DE将图结构和样本协方差信息作为自编码器的输入,在保证两种信息一致性的情况下进行嵌入学习;最后基于获得的嵌入聚类。在多个公开数据集上的实验结果表明,通过对属性和图的共同学习,GM-DE实现了对于变量间相关性的有效捕捉,在准确率等多个评价指标上取得了相比基准方法更好的聚类结果。
其他文献
众包技术通过整合互联网上的大众标注来完成计算机难以处理的问题,为工业界和学术界带来了巨大变革,在情感分析、实体解析、文本翻译等领域发挥了重要作用,为机器学习领域提供了高效的标注数据获取手段。然而,由于众包平台的开放性和隐私保护政策,众包标签往往存在噪声且缺乏先验信息。如何从噪声标签中提取正确的标签(称为真值推理)具有重要的研究和应用价值。本文围绕众包真值推理的单选问题开展相关研究,主要内容如下:(
在很多应用程序中,一个非常关键的操作是两个对象或者是多个对象之间相互模型的比较。如果结构化的信息可以用图表示,这种比较就可以转化为图的比较,而图模式匹配技术从本质上而言就是图的比较。给定一个模式图,在数据图中寻找与模式图具有相同或者相似结构的子图,这就是图模式匹配。然而目前图模式匹配的研究多集中于挖掘社交网络中满足特定要求的关系信息,在其他领域的研究相对偏少。同时由于医疗知识图谱中蕴含着大量丰富且
会话问题生成的目标是根据会话历史和文本段落生成延续历史内容的问题。目前针对会话问题生成任务的研究缺少对潜在信息的深入挖掘以及会话历史信息的关注。故本文从有答案意识和无答案意识两种方式对会话问题生成任务展开论述,具体内容如下:(1)有答案意识的会话问题生成任务需要在给定提示语句的情况下,生成与之相关联的问题。本文围绕会话历史设计单词及句子层次的注意力机制模块,提高生成的每一个单词与会话历史之间的关联
基于深度学习的目标检测模型近年来取得了巨大进步,然而检测图像中的小目标仍是目标检测领域的一大难题。由于小目标具有尺寸小、分辨率低等特点,大多数目标检测模型无法从小目标中获取足够的特征信息。本文将从不同的角度研究与改进基于深度学习的小目标检测模型,并进一步提升小目标检测模型的检测精度。本文的主要研究工作如下:(1)已有的YOLOv5目标检测模型虽然在特征增强网络中引入双向特征金字塔结构提升了检测精度
近年来,新冠疫情的爆发给人类生活方式带来了巨大的变化,其中线上学习和网络销售的用户量呈现指数式的增长,随之出现的大量文本评论常常隐藏着用户的观点和情感倾向,对这些文本评论作情感分析可以帮助政府和市场更精准分析用户意向,从而做出科学有效的决策。而传统的情感分析侧重于捕捉文本中单个实体的整体情绪,而不是捕捉该实体每个方面或特征的情感极性,使得用户对实体的看法无法被深度挖掘出来。因此提出了方面级情感分析
偏好补全已经被广泛应用到多个领域,如社交选择、推荐系统等。显然,在这些领域中,每个用户只有针对部分项目的排序,而让用户提供一份针对所有项目的完整的排序很多时候是不现实的。偏好补全的目标是利用所有人的不完整的偏好排序来推断出每个人的针对所有项目的一份完整的偏好排序。本文的主要工作如下:(1)针对现有的偏好补全方法由于偏好排序噪音的存在导致算法的准确性低的问题,本文提出了基于确定性的偏好补全算法。首先
近年来,强化学习方法被广泛用于多智能体领域。多智能体中任务复杂,可能在任务结束时才能获得环境的反馈,造成奖励稀疏的问题。受人类好奇心的启发,单智能体中解决稀疏奖励问题的一种思路是通过内在奖励促进智能体探索新颖状态,因为多智能体联合状态空间巨大,简单的将这种思路扩展到多智能体中容易造成过度探索而不能学习任务,且这种方法利用智能体观测学习状态特征不适合部分可观测环境。针对上述问题,本文基于内在动机强化
片上网络(Network-on-Chip,No C)作为新型通信架构,具备良好的可扩展性和并行性,可以满足片上日益增长的通信需求,已经成为片上多核系统事实上的标准。在片上网络的设计中,如何避免数据包路由死锁,是保障通信架构可靠性的核心问题。片上网络死锁避免领域的相关工作大都是在Dally的理论基础上发展起来的。该理论认为,如果网络的通道依赖图上没有循环依赖,网络就是无死锁的。然而,找到这样的无环图
片上网络(Network-on-Chip,NoC)现在广泛应用于多核系统当中。近几年,基于NoC的深度神经网络(Deep Neural Network,DNN)加速器被提出,它将神经元计算设备通过NoC相连。该设计能够有效地减少加速器对片外存储的访问,从而降低加速器的分类延迟和功耗。然而,在基于NoC的深度神经网络加速器当中存在着大量的一对多流量,传统的解决方式是使用单播方式传递多个相同的数据包副
雷达作为检测飞行目标的最主要手段,在飞行目标的研究中发挥着不可比拟的优势。由于多雷达融合系统的不断发展,传统的针对多传感器航迹关联和中断航迹关联的算法已经难以应对当前越来越复杂、越来越多样的雷达探测环境。为了更好地挖掘雷达航迹信息,利用航迹信息认知空间态势,从而为空域的监管提供有效的支持,本文基于深度学习技术,分别进行了多传感器航迹关联和中断航迹关联问题研究,主要研究内容如下:(1)提出了一种基于