基于单调递增神经网络的时序点过程学习

来源 :西南大学 | 被引量 : 0次 | 上传用户:shaoshao137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不管是传统的机器学习,还是现在的深度学习,事件序列预测任务都始终贯穿了它们的发展历程。具体而言,机器学习模型需要从事件序列(Events Sequence)中提取合适的历史信息,并通过这些历史信息得到未来事件的条件概率分布,从而实现对未来事件的预测。一般而言,深度学习使用循环神经网络(Recurrent Neural Network,RNN),或是带有掩盖机制(Mask)的自注意力(Self-Attention)模型,将历史信息压缩到一个高维空间的向量中,随后基于该向量构建概率分布。这种算法有两个缺点:1.可解释性较弱2.作为算法理论依据的马尔可夫过程未考虑到事件密度的影响,即事件之间的时间间隔。虽然可以将时间作为一个基础特征,输入到序列模型的历史信息之中,但是受限于当下深度模型可解释性弱的问题,目前并未找到可以通过模型参数,揭示它所学到的时间特征与预测结果之间关系的方法。而若将时间视作预测标记的一部分,由于未来事件的预测分布与编码历史信息的向量直接相关,所以在历史信息确定的时候预测分布便已经确定。这也就意味着,预测的结果与实际事件与历史事件之间时间间隔是不相关的,而这显然与现实世界的经验矛盾。上述就是时序点过程(Temporal Point Process,TPP)希望解决的问题。目前,时序点过程在医疗记录预测,地震记录预测,社交网络虚假信息的模拟与干预,以及传统的推荐系统领域均有广泛的应用。时序点模型的训练依然较为困难,原因在于训练过程中涉及了强度函数的选取,以及其负对数损失(Negative Log Loss,NLL)同时与强度函数与强度函数的定积分有关。由于在传统的时序点过程中,模型模拟的都是强度函数本身,使得强度函数的积分只能使用蒙特卡洛估计,Runge—Kutta法等数值积分方法得到,导致准确性得不到保证,训练速度很难提高,模型的大小也会受限。然而,如果复杂的深度网络模型拟合的不是强度函数,而是强度函数的积分,这个问题就不复存在了:损失函数由强度函数和它的不定积分的和变成了一个函数以及它的导数值的和。由于现代深度学习模型均基本使用反向传播训练,所以导数值会由现有的训练框架自动算出,不需要任何估计。然而,由于一些难以实现的数学限制,使得已有的模型所拟合的概率分布并不符合一些概率分布的基本性质。本文由此修改了已有时序点模型的结构,以期对已有模型进行改进。首先,本文研究如何在尽可能满足时序点过程的数学限制下,令深度模型学习强度函数的定积分。由于定积分在积分上下限相等时的值一定等于0,而传统设计思路可能会导致不可避免的历史信息丢失,我们便根据Transformer和矩阵乘法的思想,改变了原有模型中一个全连接层的定义,将其中恒定的权重修改为历史信息和时间的函数,并利用矩阵乘法的性质最终实现在特定点上得到特定输出。由于时序点过程的负对数损失存在一个下界,且这个下界与数据集和强度函数直接相关,所以不能简单使用负对数损失来表示模型学习的好坏。针对这个问题,我们首先记录了数据生成时的强度函数值和理论损失值,随后通过比对理论强度函数的图像和模型所学分布的图像,以及模型输出的负对数损失值与数据集记录的理论损失值之差来综合判断模型的准确度。相对于只使用负对数损失值,这种判断方法更加准确。另外,已有的此类模型是基于基本时序点过程的,它们通过比对不同事件的强度函数的相对大小,对未来事件类型进行判断的机制。我们随后在最初的模型上加入事件预测模块,将历史信息编码器换为Transformer,实现了对事件类型的预测。在这个过程中我们发现已有的softmax函数在直接处理只有正值的输入时可能会导致模型在强度函数的学习上出现不稳定。为了解决这个问题,我们参照已有的Transformer最佳实现,添加了倒瓶颈层(Reversed Bottleneck),并通过大量实验证明倒瓶颈层中的正则化可以大大增强训练稳定性和准确度。这项工作将使用积分拟合时序点过程的模型推广到了时间—事件空间中,使其可以更好地解决现实问题。
其他文献
癌症主要由体细胞基因突变加速积累导致细胞无限增殖引起,癌症研究的一个关键步骤是识别导致肿瘤从正常状态向恶性状态转变的驱动突变和驱动基因。此外,癌症驱动基因往往只在少数生物学通路中发生作用。因此,研究者们开始将关注点从识别驱动基因转移到识别驱动通路。识别驱动通路有助于揭示疾病发生和发展的自然规律,对癌症患者的精确治疗、新的药物靶点和诊断测试具有重要意义。研究表明,多条通路在相同的生命活动和致癌过程中
学位
随着科技的发展和信息化设备的普及,现实世界中实体间联系的多维度属性愈发明显,如社交网络中存在不同的社交平台,分别表示用户不同的社交偏好,具有不同的社交属性,准确表征用户在不同社交平台下多维度的社交行为,对于社交网络的分析研究具有重要意义。由于多层网络独特的分层结构,使其能准确刻画实体间的多维度联系,因而已经逐渐成为建模、分析和研究多关系复杂系统的重要工具。在网络科学中,识别多层网络潜在的社团信息对
学位
随着时代的发展,人们对社会公共安全的需要也不断提高,越来越多的学者投入到相关领域的研究中。行人重识别作为一项人工智能技术,被广泛的运用到城市的安防系统中,其主要研究内容是在跨设备下的监控图像或者视频序列中检索出目标行人。现有的行人重识别方法大多集中在对一个模态的研究,即可见光模态,所用的行人图像均取自于工作在白天的可见光摄像头。事实上,这样的摄像头并不能在弱光或者黑暗的条件下捕捉到有效的行人信息。
学位
随着语义网的不断发展,RDF(Resource Description Framework,RDF)数据已被广泛用于各个领域的知识建模与数据重用,导致其数据量呈现出爆炸式的增长。RDF数据所形成的RDF图知识库(简称为RDF图)也从刚开始的仅数百万条数据增长至上亿条数据,其中开放关联数据(Linked Open Data,LOD)截止到目前已拥有超过620亿条链接数据。各领域RDF数据的不断增长,
学位
使用频率高、运动损伤(如摔跤)、疾病(如脑中风)等都可能导致腕关节功能性障碍。腕关节康复训练在促进功能障碍恢复中起着重要作用。AR(Augmented Reality,增强现实)技术是一种借助相关技术把虚拟对象无缝叠加到真实世界中,从而实现对真实世界环境增强补充的技术。将AR技术和腕关节康复相结合,把计算机生成的虚拟指导训练信息叠加到病患腕关节真实训练过程中,让病人清晰、明确地看到自己当前肢体动作
学位
古文字作为人类用符号来记录古代历史、经济、文化、科学技术发展的瑰宝,其对文明历史的传承和知识文化的传播发挥着不可替代的作用。然而古文字一直是冷门领域,相关的研究资料也是非常贫瘠。究其原因主要是其自身的特殊性,比如需要掌握丰富的专业知识和多年的研究经验的学者,同时由于历史发展和保护条件有限,大量古文字载体存在不同程度的损毁。因此古文字的保护研究工作迫在眉睫。古文字识别是古文字学最为核心的研究课题,本
学位
随着经济社会和科学技术的不断发展,社会的交互关系逐渐网络化,如从企业邮件转发网络到全球通讯网络,从城市居民出行网络到全球交通网络。这些网络从抽象、具体,以及微观、宏观等多个层面对现实的复杂系统进行描述,因此通过利用网络科学和计算机科学的理论来挖掘复杂系统中的共性特征和潜在的组织结构,为理解复杂而又抽象的现实世界提供了有效的依据。然而,当今社会经济的不断膨胀引起了网络规模的急剧扩张以及复杂化,给网络
学位
作为自然语言处理领域的一项关键任务,实体关系抽取受到越来越多的关注,其目的是从原始文本中获取结构化知识,得到<头实体、关系、尾实体>形式的三元组。提取的三元组被广泛用于知识图谱、智能搜索、电商推荐、问答系统等领域,有着重要的研究与应用价值。实体关系联合抽取利用实体和关系间紧密的信息交互,同时抽取实体以及实体对之间的关系,很好地缓解了流水线方法所存在的错误传播等问题。中英文由于语言之间的差异性,在实
学位
近年来,随着互联网技术的发展以及信息搜集工具的进步,我们的生活已经被各种各样的数据包围。数据信息已然成为了一种十分重要的资源,对人们有着十分重要的意义。如何从海量的,纷繁复杂的数据中提取有用的信息成为了科学界与产业界共同关注的热点。因此,各式各样的数据挖掘方法被不断地提出。聚类,作为数据挖掘领域地一个重要的技术手段,它可以在无任何先验知识的情况下,通过探究数据之间的内在关系来将一组对象进行划分归类
学位
自然界中的事物以不同的形式相互联系着,这种联系构成了一种复杂的系统。如何从这种复杂系统中寻找出其内在蕴含的信息,揭示系统的运行规律,探究事物发展和联系的本质,已逐渐成为科学家的研究焦点。如果把复杂系统中的事物个体抽象为网络中的节点,把事物个体间的关系抽象为网络的连边,那么就可以把复杂系统抽象为复杂网络。随着对复杂网络研究的不断深入,复杂网络的分析方法已渗透到现实世界的各个领域,被广泛应用于社会、交
学位