【摘 要】
:
无监督学习因为有着能够利用未标记的数据进行训练的特性,成为人工智能领域讨论的热点之一。基于能量模型的生成对抗网络就是一种学习数据的非规范对数密度的无监督学习方法。针对现有的能量模型框架,本文提出一种非参数估计邻域熵算法的能量模型(NEEM),主要工作如下:(1)提出非参数估计邻域熵算法的能量模型(NEEM),算法在考虑每个样本点附近k近邻区域的非均匀概率密度的情况下,通过给经典熵估计方法增加局部高
论文部分内容阅读
无监督学习因为有着能够利用未标记的数据进行训练的特性,成为人工智能领域讨论的热点之一。基于能量模型的生成对抗网络就是一种学习数据的非规范对数密度的无监督学习方法。针对现有的能量模型框架,本文提出一种非参数估计邻域熵算法的能量模型(NEEM),主要工作如下:(1)提出非参数估计邻域熵算法的能量模型(NEEM),算法在考虑每个样本点附近k近邻区域的非均匀概率密度的情况下,通过给经典熵估计方法增加局部高斯来进一步拟合真实分布从而减小误差。通过实验将NEEM与当下的生成模型进行比较,验证该模型在生成性能上能够弥补当下模型存在的模式损失问题,同时提高模型训练的速度。(2)NEEM在基于softmax函数的分类器问题中的应用。提出将从softmax迁移函数获得的逻辑值来为样本点和标签的联合分布定义一个基于非参数估计邻域熵能量的模型,通过混合建模验证模型在保留生成式建模与判别式建模方面的优势之外,模型的收敛速度更快。(3)NEEM在基于softmax函数的分布外(Out Of Distribution,OOD)检测问题中的应用。提出使用NEEM中的能量分数来代替softmax置信分数进行分布外样本的检测。通过分析能量分数和传统的softmax置信分数之间的关系,证明了由于softmax函数偏置量的存在,导致其与输入样本的概率密度不一致,并不适合来检测分布外样本,而使用NEEM中的能量分数,因为其具有与输入样本的概率密度保持相关性的特点,能够改进softmax置信分数因后验分布产生的过拟合问题。
其他文献
随着国民经济和对外贸易的快速发展,国际、国内航运事业需求旺盛,中国的航运业已经成为全球市场最具活力、增长力的市场之一。随着航运事业的发展,来往船舶数逐渐增多,航道拥堵问题日益严重,海上交通安全和船舶航行时间长等问题也随之出现。虽然VTS在很多港口已经投入使用并积累了海量的雷达数据,但目前对这些数据的使用却不是很充分,大量的历史数据被遗弃在数据库中,还消耗着存储资源。目前各个港口的VTS基站都只是针
优化问题是一个热门的研究领域。很多现实中复杂的工程和科学问题都可以被抽象为大规模全局优化问题。大规模全局优化问题具有决策变量维度高(一般超过100维)、搜索空间过于广泛以及大量的局部最优性等特点,因此从大量的解决方案中寻找最佳解决方案是研究的重点。进化算法是目前公认的求解大规模全局优化问题的卓有成效的方法。粒子群算法作为一种基于种群协作的全局寻优进化算法,以其实现简单、参数少以及收敛性能好等优点被
现阶段信息数据每天都在以指数级增长,而在海量的信息数据中,文本数据是最为常见的一种。在实际的生活中大部分文本数据集分布都是不平衡的,而原始的文本分类算法大都在平衡的数据集上进行训练,当在实际的数据不平衡的情况下进行应用时,会对模型的分类效果产生较大影响,因此,如何高效的对不平衡文本数据进行分类是一个具有现实意义且急需解决的问题。本文针对不平衡文本数据集(二分类)存在的问题,从类别损失、特征提取两个
近年来我国电子商务发展突飞猛进,网购人数呈指数性增长。随之而来,面对电商平台海量商品信息给网购用户带来的“信息过载”问题,基于用户选择偏好预测的商品推荐系统所蕴含的重要商业价值日益引起社会各界的广泛关注,并逐渐成为这一领域的研究热点。从实践应用来看,亚马逊早在2003年便已投入推荐系统的设计与研发,并在其网站上率先实现了基于协同过滤的商品推荐系统,同时带动了电商平台内推荐系统的广泛应用。从技术角度
日本普惠保险的发展经历了从以保险商品为中心、以区域和行业普及为中心到以业态形成为中心的演变。20世纪初期,日本以简易生命保险产品快速普及普惠保险,配套设置以国家信用为担保的简易生命保险特别规则。20世纪中期,日本以共济业为中心,形成了普惠保险的区域和行业发展模式,共济规制理念和做法经历了以强调个性到注重共性的变迁。1995年放松保险业规制后,日本在立法层面创设小额短期保险业,经由特别立法扶持行业发
图像作为信息传输的重要载体,保证图像在互联网中安全的传输是一个巨大的挑战。利用混沌特性设计新密码系统,以保证信息的安全存储和传输,是当前混沌密码学面临的迫切任务。本文结合混沌动力系统与布尔网络理论,对混沌图像加密算法设计与模型构建开展了以下研究。(1)结合矩阵半张量积(Semi-tensor Product,STP)理论设计了一种高效的混沌图像加密算法。此方法打破了传统矩阵运算的束缚,使反应矩阵具
财务领域的知识体系复杂庞大,相关政策更新迭代速度频繁,人们日常办理财务业务可能会遇到各种各样的问题,因此需要准确高效的获取财务领域的知识。传统的方式是拨打咨询热线,但当咨询量大、线路繁忙时,用户不能及时的获取知识。随着互联网的快速发展,财务知识的获取大多来源于网络,但财务领域知识具有专业性高、私密性强等特点。用户通过网上搜索的方式难以真正的获取到有效的信息。为解决以上提出的问题,本文结合深度学习、
场景识别是对无结构化数据进行智能处理,从而使其变成可供计算机自动识别的分类问题,是一种综合运用计算机视觉、行为识别和人工智能的重要技术。在大数据和人工智能的时代背景下,场景分类技术广泛应用于遥感图像处理、视频图像处理、智慧城市和智能家居等领域之中。其中,视频场景分类是计算机视觉领域一个热点的研究问题,其目标是综合运用图像处理、机器学习、模式匹配和人工智能等技术实现场景的语义理解,在视频分析、视频剪
在信息数据快速传播的时代,数字图像传输的频率很高。在保护图像信息的各种方法中,对图像进行加密是一种非常有效的措施。与文本和语音相比,图像表示的信息更加生动,但这也意味着图像信息量很大,冗余度很高,相关性很强。因此,传统的加密方案不能保证加密的安全性要求。遗传信息分为脱氧核糖核酸(Deoxyribo Nucleic Acid,DNA)和核糖核酸(Ribonucleic Acid,RNA),DNA计算
税收是国家组织财政收入的主要形式与工具,税务持续受到社会公民的广泛关注。伴随我国税务信息化建设的全面开展,税务办理效率显著提升,但目前税务存在业务内容复杂、征管关系繁多、时效性较差等问题。纳税人无法全面了解税务政策,税务办理存在的问题主要通过咨询客服专员得以解决,方式单一且人力资源投入较大,无法在较短时间解决大量用户的税务咨询需求。针对当前税务办理存在的问题,论文基于自然语言处理技术与系统开发相关