基于听觉模型的语音可懂度非侵入式预测方法研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:sly4352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音通讯在信息产业中应用广泛,因此,作为语音信息载体的通讯系统,其性能好坏直接影响到整个语音通讯的顺畅程度。对通讯系统性能进行评价的关键在于其所输出语音可懂度的高低。可懂度的评估分为主观和客观,主观评估的优势在于其评价结果与人的感受相符,缺点是费时费力,所以,为克服主观评估的不足,人们开始寻求以计算机技术为中心、最贴近人的主观评估的客观方法。传统的客观方法是基于二阶统计量,通过计算其功率谱包络预测语音可懂度变化,但语音系统存在多种环境噪声以及语音传输设备带来的非线性失真。高阶统计量常用于系统的非线性检测和信号特征提取,由于目前客观评价方法多为侵入式,即需要纯净语音信号作为参考预测语音可懂度,在现实环境中纯净语音很难获取。基于以上本文提出一种基于双谱特征的语音可懂度非侵入式的客观评价算法,并在此基础上做出进一步改进:提出一种基于听觉模型的提取双谱特征预测语音可懂度算法。通过实验仿真结果验证,该方法对语音信号失真变化敏感,更加贴近人耳对语音信号的感知和处理过程,评价结果与主观具有很高的相关度。论文的主要研究内容如下:(1)针对现有的语音可懂度评价方法的原理和算法进行了推导和分析,对目前客观评价算法中存在的缺陷以及未来发展前景做出了剖析。(2)提出了基于双谱特征的语音可懂度评价算法(Bispectral Speech Intelligibility Metric,BSIM),该方法为非侵入式预测,即每次预测可懂度变化时不需要纯净语音的参与。利用双谱可以处理语音信号的非线性和非高斯的特性,检测信号的相位耦合。从语音信号的双谱中提取单一特征值,即对角元素振幅的一阶谱矩(H3),该特征值与语音可懂度的变化具有强烈的单调性,能够反映信号的失真变化。通过MATLAB进行仿真实验,提取多种失真环境下的信号的特征值并计算语音可懂度的分数,实验结果表明BSIM相较于传统方法,其与主观评价分数的相关系数都有了明显提高。(3)为了获取更接近主观评价的预测方法,针对BSIM算法的缺点进行改进,进而提出了一种基于听觉模型的语音可懂度非侵入式预测评价算法(Gammatone and Meddis Bspectral Speech Intelligibility Metric,GMBSIM)。目前存在的客观方法并未考虑人耳对语音的处理,人的听觉系统对语音信号的处理能力远超出数字信号处理水平。将语音信号通过听觉模型,基于模型输出的听神经发放率进行双谱特征提取并计算语音可懂度的分数。所改进算法的性能通过Simulink建模仿真实验进行验证,实验结果显示该方法的可懂度评价结果与主观评价的相关系数更高,相比于BSIM和传统算法均有了明显提高。
其他文献
为了提高地区电网无功补偿效率与电压无功控制质量,文章总结了无功补偿的意义和电压无功控制的重要性,分析了无功补偿对电压的影响,提出了地区电网无功补偿与电压无功控制措施。实践表明,做好地区电网无功补偿与电压无功控制,对于提升电网运行的稳定性、促进当地经济的发展具有重要的作用。
期刊
为了减缓全球变暖,大力发展可再生能源发电势在必行;微电网的出现极大程度上克服了可再生能源发电间歇性和不确定性的缺点。装备有可再生能源发电设备和储能系统的终端用户,作为微电网中的一个自主实体,充分利用了城市太阳能、风能等可再生能源进行自发电,进一步开发了可再生能源发电的潜力。终端用户的这一特性为微电网电力市场带来了一种新的交易模式,即点对点(Peer-to-Peer,P2P)能量交易。该方法允许终端
学位
随着芯片制造工艺不断升级,晶体管的体积已向纳米级延伸,越来越接近物理极限,摩尔定律也逐步走向终结。由于DNA具有结构稳定、尺寸可变等特点,科学家将目光锁定在了 DNA身上,DNA纳米技术已成为很多科研人员探索的热点之一。1994年,美国加利福尼亚大学Adleman博士开创性的提出基于生物化学反应求解哈密顿回路问题的DNA分子计算模型,拉开了 DNA计算的序幕。DNA折纸技术又为纳米微观控制的实现添
学位
随着新一轮电力体制改革的持续深化,省级电网企业的角色定位由电能供应商转为综合能源服务商,企业盈利模式、业务布局、内外部环境均发生深刻变化,生产经营呈现更加复杂、多元的特征。在此背景下,以A省为代表的省级电网企业亟需对其生产经营中一切有关经济目的的活动开展深层次、多角度经济活动分析,准确、及时地把握企业当前经济活动水平,助力企业未来决策与发展。但是,当前A省电网企业对经济活动分析的实务工作存在着分析
学位
近年来,随着智能电网建设不断加快,现代电力系统对电流测量传感技术提出了更高的要求。基于Farady效应的直通式磁光电流互感器不但弥补了传统电磁型电流互感器体积大、存在铁磁谐振现象、暂态特性差等运行缺陷,而且易于信息传输的数字化输出,顺应了智能电网的数字化、网络化发展潮流,是目前电流测量传感技术的研究热点。针对直通式磁光电流互感器抗磁干扰能力差的问题,本文提出了一种新型的三相集群式磁光电流互感器(T
学位
电容式电压互感器(CVT)是高压电网中最关键的设备之一,其测量不仅是电力系统监测和控制的基础,也是确保电力系统安全、稳定、经济运行的关键因素。因此,早期识别CVT内部故障非常重要。传统检测CVT内部故障最常用的方法是周期性的介损检测、电桥检测和红外测温等,这些方法需要CVT停电进行,耗费大量人力和经济成本。为此,本文采用PSCAD对220kVCVT的等效电路进行了仿真建模,理论分析了不同位置匝间击
学位
文章以合肥市轨道交通3号线南延线站前路110kV主变电所为例,结合着轨道交通线路的建设时序、用电负荷情况、无功功率产生情况,对主变压器安装容量选择和无功补偿配置方案进行了分析。分析认为:(1)2×40MV·A的变压器容量能够满足正常运行方式下的全所总负荷供电要求,以及相邻主变电所解列时的支援供电要求,并且最终负载率约控制在0.5~0.6左右,有利于降低变压器损耗,提高节能效果。(2)本期1#主变低
期刊
企业的资金是企业生存和发展的基础,而营运资金则是企业资金的重要组成部分。营运资金管理是企业财务管理的重要内容,其管理水平的高低直接关系到企业生产经营活动的正常进行,进而影响到企业的经营绩效。随着市场经济竞争日趋激烈,企业如何通过科学有效的营运资金管理,提高运营效率和竞争力,使企业实现可持续发展成为当前必须解决的问题。基于此,本文就企业营运资金管理的OPM战略展开分析,以供参考。
期刊
随着我国能源转型步伐的加快,风电装机容量和并网比例不断攀升,其随机性和波动性显著增加了电力系统平稳运行面临的风险,电力系统需要保有足量的备用,但传统意义上根据系统负荷固定比例来确定备用容量的方式并未考虑到风电并网的影响,不再适用于当前含高比例风电系统备用容量的确定。此外,我国持续推进电力市场建设进程,备用辅助服务市场作为其中关键一环,其重要性不言而喻,在双侧开放市场中,供给侧火电机组和需求侧可中断
学位
随着海上风电的快速发展,大型直驱结构的风电机组因其结构紧凑,可靠性高,效率高等特点日益受到风电行业关注。相比于双馈型机组,直驱永磁、中速永磁、高速永磁风电机组均采用永磁体作为励磁源,因此由永磁体自身特性导致的退磁故障机理成为研究要点。鉴于此,以一台8.8MW大型直驱型风电机组外转子永磁发电机为研究对象,建立退磁故障模型,分析机组退磁故障机理,总结退磁特征参数变化规律,围绕上述内容,在国家重点研发计
学位