基于张量神经网络的音频多语义分类方法

来源 :计算机应用 | 被引量 : 4次 | 上传用户:yulequ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频特征向量已广泛应用于音频分类的研究,该表示形式虽能有效体现音频的固有特性,但无法表示音频信息多语义特性及各语义间的相关性。提出了基于张量统一内容定位(TUCL)的音频语义表征方式,将音频语义描述表示为三阶张量,并构建多语义张量空间。在此空间中,张量语义离散度(TSD)能有效聚集具有相同语义的音频资源,通过计算各音频资源的TSD来完成对音频资源的分类,并构建了RBF张量神经网络(RBFTNN)来自适应学习分类模型。实验结果表明,在多语义分类的情况下,TSD算法的分类性能明显优于当前典型的高斯混合模
其他文献
从"互联网+市场"就业模式优势分析入手,探讨了其现实基础,并研究了云南高校毕业生"互联网+市场"就业模式的探索和实践,结合当前互联网就业现实问题,探索形成云南省大中专毕业生就业
针对目前图像融合质量客观评价与主观评价结果一致性不高的问题,结合人类视觉注意机制和区域计算方法对EFQI指标进行改进,提出了一种基于视觉注意机制(VAM)与区域结构相似度的图像融合质量评价指标。该指标充分考虑了人类视觉感兴趣区域和人眼对区域信息敏感的特性,使用方差显著图与视觉显著图相结合的加权方法对图像中的显著区域赋予更大的权值,并采用更符合人类视觉特性的区域计算方法求取融合结果图像和源图像在各区
针对在连续优化中,蚁群算法(ACO)存在的收敛速度慢和易陷入局部最优的问题,提出了一种新的含维变异算子的连续域蚁群算法(DMCACO)。该算法采用动态随机抽取的方法来确定目标个体,引导蚁群进行全局的快速搜索,同时在当前最优蚂蚁邻域内进行小步长的局部搜索。在定义了维多样性概念的基础上,引入维变异算子对维多样性最差的维进行变异:让所有蚂蚁在该维上的位置重新均匀分布在可行区域上。对测试函数所做的仿真实验
背景:近年来随着科学技术的发展,三维模型越来越多的运用到医学领域中。气道管理是麻醉手术中最重要环节之一,而在国内外较少见有关人体气道三维有限元模型的研究。目的:应用
我国高校重点实验室数量多,科研及教学任务重,近年来发展迅速,但存在的问题也较为突出。文章重点分析了高校重点实验室在管理层次、开放体制和管理模式等方面的问题和成因,提
背景:异体器官移植是解决终末期器官衰竭最为有效的方法之一,有效克服移植排斥反应、成功诱导移植免疫耐受是器官移植亟待攻克的重大难题,临床目前所用免疫抑制药仍存在减轻