【摘 要】
:
语音和乐音是我们生活中常见的两种音频信号,在语音与乐音混合的信号中包含了很多有用的信息比如:说话人身份、语音内容、乐曲旋律等。因此在语音与乐音的混合信号中进行提取有效信息在语音识别、音频检索、计算机听觉等领域有着重要应用。盲源分离(blind source separation,BSS)技术可以实现混合的语音与乐音信号的分离,其可以理解为在源信号和传输通道参数未知的情况下,根据其输入源信号的统计特
论文部分内容阅读
语音和乐音是我们生活中常见的两种音频信号,在语音与乐音混合的信号中包含了很多有用的信息比如:说话人身份、语音内容、乐曲旋律等。因此在语音与乐音的混合信号中进行提取有效信息在语音识别、音频检索、计算机听觉等领域有着重要应用。盲源分离(blind source separation,BSS)技术可以实现混合的语音与乐音信号的分离,其可以理解为在源信号和传输通道参数未知的情况下,根据其输入源信号的统计特性,仅对观测信号进行处理而恢复出源信号的过程。在语音与乐音的混合信号中认为它们的源信号是相互独立的,当源信号各个分量具有独立性时,盲源分离过程称为独立分量分析(independent component analysis,ICA)。独立分量分析主要由准则函数与优化算法构成,在分离混合信号时的核心问题是选取性能优越的优化算法使准则函数结果达到最优。常用的准则函数有:互信息最小化法、负熵最大化法、极大似然法、四阶累积量等,利用这些准则函数来判断分离后各信号的独立程度。在准则函数确定以后,则选取恰当的优化算进行寻化使其独立性最大。常见的优化算法有:遗传算法、人工蜂群法、粒子群算法等。智能优化算法的应用,可以克服独立性准则函数的优化进入局部最优位置,但是,这些传统优化算法都具有一定局限性,这些优化算法的性能依赖控制参数的选择,因此,提出利用一种单参数的纯随机搜索的单形进化优化算法(surface-simplex swarm evolution,SSSE),克服算法参数对优化算法性能的影响,提高盲分离算法的应用有效性,其思想是根据粒子的单形邻域特点利用单形邻域搜索机制与多角色进化搜索策略。仅需设置种群数目这一个参数,在全随机二维子空间中,利用单形邻域凸集逐步逼近与搜索定位进行寻优,减少了对初值的依赖。本算法采用群体协作搜索和竞争选择的方式,在搜索方案中利用粒子多角色态,实现粒子多样化,改进了搜索的全局性。实验根据语音与乐音信号特点选取四阶累积量作为独立分量分析的准则函数,将单形邻域与多角色进化优化算法与独立分量分析相结合,对语音与乐音混合信号进行盲分离,算法通过搜索算子的全随机搜索性与多角色态特性,对准则函数进行优化使分离效果达到最优。通过仿真实验,实验结果表明,该改进算法有效分离出语音成分与背景乐音成分,而且在稳定性和分离效果方面具有较好的性能。
其他文献
人民生活、经济快速发展的同时,环境污染与卫生问题也日渐突出,近些年雾霾、全球变暖以及肺炎疫情等严峻问题的出现,迫切要求社会各界的共同参与。手机的快速普及与社交媒体的发展促进了互联网公益的兴起,在众多互联网公益平台中,蚂蚁森林在环保、公益传播方面取得了显著的效果,在建设互联网公益平台以及用户行为影响方面具有一定的借鉴意义。本文通过对蚂蚁森林进行分析,解决以下两个问题:一是探讨互联网公益平台的设计模式
农作物病害和虫害是造成全世界粮食减产的最重要的两个因素,尽管植保无人机的应用使得农药的喷洒可以实现自动化,但是农作物病虫害的识别与检测依然需要大量的人力和时间成本。深度学习技术正可以解决这一难题,利用植保无人机进行病虫害的检测可以实现智能化和精细化的病虫害防治。随着计算机硬件和深度学习理论的不断发展,基于深度学习的目标检测算法也已经越来越成熟,但是目前主流的深度学习目标检测算法很难直接应用于植保无
集体林权体制的改革对于提高林农收入、林业经营效率有着十分重要的意义。建立充满生机和活力的林业体制机制的一次重大实践,是继家庭联产承包责任制之后中国农村经营体制的
石墨烯是一种新型的二维碳纳米材料,拥有独特的晶体结构。正因为其独特的结构,使其具有非常优秀的电学、光学、力学及热学性能。基于这些优秀的性能,如何高效地制备并有效地改善石墨烯成为这些研究的前提,大面积地并高质量地制备石墨烯仍然是研究人员急需攻克的难题。在现有的制备石墨烯的方法中,主要分为湿法和干法。湿法包括喷涂、旋涂、抽滤沉积等,其通常先制备氧化石墨烯(Graphene Oxide,GO),然后再通
急性淋巴细胞白血病是一种影响广泛的急性癌症,主要发病人群是0至9岁的儿童,若未能及时发现和治疗,往往在几个月内就会导致死亡。因此,白血病的早期诊断对患者的治疗非常重要。然而,由于正常白细胞和癌细胞之间存在着高度相似的形态,使病理医生的诊断变得尤为困难。虽然有类似流式细胞仪的仪器可以辅助医生诊断,但是其昂贵的价格,使之难以普及。随着近年来硬件的提升和深度学习技术的发展和应用,计算机辅助医生诊断成为可
认知策略是学习者内部组织起来的,为了指导自己注意、学习、记忆和思维而主动使用的加工和调控信息的方法和技能。在新一轮课程改革的推动下,学生不仅要学习专业知识,还应掌握学习的方法,也就是认知策略的应用方法,这也是当代教育研究的主题之一。本研究通过文献调查法、问卷调查法、教育实验研究法对高中生物教学中培养学生的认知策略进行了初步的研究,结合高中生物教材设计教学案例并进行教学实践。主要内容如下:本文通过文
洗钱是指通过复杂的银行转账或商业交易行为将“脏钱”转移给他人而隐藏的货币非法来源的过程。洗钱行为往往和毒品交易、恐怖主义等犯罪行为有关,严重影响了社会的和谐与稳定。所以洗钱行为的检测有重大的社会经济意义。犯罪分子往往采用跨行交易的方式进行洗钱,躲避银行对资金的追踪和分析。现有的密度子图检测算法侧重于在二部图上检测密度子图,这种算法只能检测直接资金转移过程中存在的异常行为,而跨行洗钱涉及多层账户之间
材料作为现代文明的三大支柱之一早已与人类生活息息相关。金属材料作为主要工程结构材料,在石油化工、航天航空、核电站等领域广泛应用。随着各种工程设备的服役环境日益复杂,由金属材料脆性断裂引起的事故屡见不鲜。国内外对于金属材料脆性断裂的研究大致分为两个方面:宏观上利用断裂力学理论模型对材料断裂参数和材料断裂判据进行研究;微观上探究材料微观组织结构的组织特征、几何特征以及它们的变化对材料宏观性能改变的影响
在大数据时代,图像已经成为人们日常生活中主要的信息载体。然而图像在成像以及传输过程中会不可避免的引入各种失真,引发图像质量的衰减。而图像作为人类主观感知、机器视觉的主要信息源,其质量好坏直接决定所获取信息的有效性。因此如何评价图像质量,以及图像质量是否满足特定场景要求亟待解决,而这个问题的解决需要建立合理的图像质量评价方法与评价标准。客观图像质量评价方法的发展离不开数据库的支持,图像质量评价数据库
随着工业化的不断推进,资源短缺、环境恶化对经济社会的可持续发展构成了越来越严重的威胁。人们的可持续发展观念和环境保护意识不断提高,供应链上下游企业为了获得可持续发