【摘 要】
:
将正弦注意力表征网络引入环境声音识别,首先提取梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为音频识别特征,使用门控循环单元提取MFCC每一帧的特征,根据
【机 构】
:
中南林业科技大学人工智能应用研究所,湖南长沙410004;中南林业科技大学计算机与信息工程学院,湖南长沙410004;中南林业科技大学人工智能应用研究所,湖南长沙410004;中南林业科技大学智慧物流
论文部分内容阅读
将正弦注意力表征网络引入环境声音识别,首先提取梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为音频识别特征,使用门控循环单元提取MFCC每一帧的特征,根据正弦函数激活每一帧音频得分,并依照每一帧的音频得分为音频重新分配权重,从而将注意力集中在音频重点区域.最后结合全连接层和Softmax分类器对环境声音类别进行判别.实验在公开数据集Urban Sound 8K上验证并与其他模型对比,结果表明所提出模型效果最好,在数据集上的识别率高达93.5%.
其他文献
针对传统无线传感器网络能量供应问题,提出了基于射频能量捕获的无线传感器网络介质访问控制(medium access control,MAC)协议.首先在相邻节点之间运用时分多址(time divisio
提出了一种针对竹笛技巧分类的数据集Breath和两个用于竹笛技巧分类的神经网络参考模型Breath1d和Breath2d,并针对此数据集的不同分类任务给出了最佳方法.将Breath数据集划分
鉴于传统的异质信息网络通常存在的高维稀疏性缺点,首先提出将异质信息网络的高维顶点嵌入低维向量空间的无监督学习模型—— 基于生成对抗网络的异质网络表征学习(heterogen
以佛山市高明区三洲盆地作为研究区,在系统收集区内区域地质、构造、工程、水文、环境、历史灾害等基础上,通过野外走访调查,查明了研究区岩溶塌陷发育特征,并对其时空分布规律进行了分析。结果表明:(1)区内岩溶塌陷规模以小型为主,其平面形态以圆形、似圆形为主,其剖面形态以漏斗状居多,并且剖面形态随覆盖层厚度增大总体呈现由圆柱状—坛状—漏斗状—碟状的变化规律;(2)空间上岩溶塌陷的分布受地层岩性、地质构造、覆盖层厚度及结构、地下水迳流和人类工程活动等影响;(3)时间上人为塌陷的发生主要与采矿活动和钻探施工时间关系密
针对如何精准识别僵尸企业的问题,借助湖南科创信息有限公司公开的企业信息数据集,提出了一种决策树-逻辑回归的僵尸企业识别方法.该方法用中位数填充缺失数和离群值,然后分
在划分气象风险等级时,传统地质灾害气象风险预警方法忽略了承灾体脆弱性因素,且气象风险预报等级整体偏高,导致高等级风险区空报率较高.基于此,提出基于机器学习的滑坡、崩
以渤海海域海底地质灾害为研究目标,采用层次分析法(Analytic Hierarchy Process,AHP),按照海洋水动力条件、工程地质环境、灾害地质条件、人类工程活动4个类别,遴选了8个评价因子,详细论述了各地质灾害评价因子的分布特征,通过定性分析和定量计算相结合,开展了渤海海域海底地质灾害评价及危险性区划。将渤海海域海底综合划分为地质灾害危险性高危险性、较高危险性、较低危险性和低危险性4个区域。研究成果可为渤海海域的工程建设和防灾减灾提供科学依据。
在云服务和物联网发展热潮带动下,大数据、4G/5G移动通信、空间信息传输已经在国民经济各行各业中广泛应用.在超大规模数据中心以及电信骨干/接入网频宽升级需求带动下,作为
复眼式光学成像系统在大视场侦查、图像识别、目标探测等领域较传统单孔径光学系统优势突出,但随着视场的增加,子孔径本身的成像畸变及多个子孔径的安装位置误差引起的畸变会直接影响拼接图像的质量。针对该问题,采用光电测量技术对复眼系统进行畸变测量与校正,生成多模动态电子畸变测量靶标,构建畸变测量校正模型,建立多项式拟合算法,采用最小二乘法获得畸变系数,通过双线性插值法模型对图像进行重建。实验结果表明,校正后
2021年2月7日,印度查莫利北部里希恒河发生高位冰岩山崩堵江溃决洪水灾害链,造成下游20km外的水电站和桥梁设施破坏,死亡、失踪人口近200人.文章运用多期高分辨率遥感影像,对