基于多分辨率特征和时频注意力的环境声音分类

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:rovewind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对环境声音分类(ESC),提出了一种基于多分辨率特征和时频注意力的卷积神经网络环境声音分类方法.首先,相较单一分辨率的谱图,多通道多分辨率特征可以丰富特征信息,实现不同特征分辨率之间信息互补,增强特征的表达能力;其次,针对声信号提出了一种时频注意力模块,该模块先利用不同大小的一维卷积分别关注时域和频域有效信息,再用二维卷积将两者进行融合,从而抑制环境声中背景噪声并消除由多通道多分辨率带来的冗余信息干扰.实验结果表明,在ESC-10和ESC-50两个基准数据集上的分类准确率达到了98.50%和88.46%,与现有的最新方法相比分别提高了2.70%和0.76%.
其他文献
药用植物文本的命名实体识别对中医药领域的信息抽取和知识图谱构建起着重要作用.针对药用植物属性文本存在长序列语义稀疏的问题,提出一种基于注意力机制的双向长短时记忆网络(BiLSTM)和条件随机场(CRF)模型相结合的疾病实体识别方法(BiLSTM+ATT-CRF,BAC).首先对药用植物属性文本进行预处理和半自动化标注构建数据集,并进行预训练得到低维词向量;然后将这些低维词向量输入BiLSTM网络中,得到双向语义依赖的特征向量;Attention层把注意力集中到与当前输出特征高度相关的信息上;最后通过条件随
为了总结前人工作,给相关研究者提供思路,首先讨论了当前多模态知识图谱的基本概念,然后从图数据库和知识图谱这两个角度介绍了多模态知识图谱的构建工作,并总结了两种主要方法的思路.还分析了多模态知识图谱的构建和应用中的关键技术和相关工作,如多模态信息提取、表示学习和实体链接.此外,列举了多模态知识图谱在四种场景中的应用,包括推荐系统、跨模态检索、人机交互和跨模态数据管理.最后,从四个方面展望了多模态知识图谱的发展前景.
针对现有微博推荐中未考虑分层关系对兴趣影响的问题,提出一种基于分层社交关系的微博推荐算法.首先基于时间窗口计算相对亲密强度与社交增长率来构建分层网络;其次在网络中量化影响力、吸引力、交互紧密度来挖掘目标用户潜在兴趣;然后依据短文本扩展策略获取目标用户显性兴趣;最后将潜在兴趣与显性兴趣融合,计算融合兴趣与待推荐微博的相似度实现推荐.实验结果表明,与经典的微博推荐方法相比,该算法在准确率、召回率、F值、MRR上均优于其他方法,最高提高了14.73%.由实验结果可知,综合考虑潜在兴趣和显性兴趣可以提高微博推荐效