基于感知压缩理论的音频信号采样与重建方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:xujc8639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
压缩感知理论带来了一种全新的信号采样方式。当信号本身或在某个变换域具有足够稀疏的表示时,能够以低于奈奎斯特定理要求的采样率对信号进行采样,并对其完美地重建。对于用于声场采集的多麦克风阵列来说,这一技术可以极大地减轻海量数据对采样端造成的压力。然而,由于音频信号种类的繁多及稀疏度的不一致,压缩感知理论很难直接应用于实际音频信号。针对这个问题,本文提出了一种基于结构化先验的音频信号压缩采样重建算法。该算法以改良离散余弦变换(Modified Discrete Cosine Transform,MDCT)作为稀疏变换基,并以高斯混合模型描述音频信号MDCT系数的边缘分布。另外,本文以一阶马尔可夫链捕捉音频信号系数在时频维度表现出的结构特性,根据不同类型音频信号的不同的结构特性,一阶马尔可夫链可以分别建立在时间维度和频率维度。为了提高算法的自适应性,对于不同的音频信号帧,信号模型采用不同的超参数,并以最大期望(Expectation Maximization,EM)算法以在线地方式学习这些超参数。本文进一步以概率图模型描述提出的信号模型,以最近提出的近似信息传递(Approximate Message Passing,AMP)为算法框架,在因子图(Factor Graph)不同的节点之间通过信念传播(Belief Propagation,BP)推导出了针对音频信号的高效重建算法。实验结果表明,本文提出的单通道重建算法在音频信号重建精度上相对于目前性能最好的几种算法具有3-5dB的优势。对于多通道音频压缩感知问题,本文在单通道重建算法的基础上,采用高斯-马尔可夫过程对信号系数在空间维度的缓慢变化建模。考虑到不同空间区域多通道音频信号相关性的差异,本文进一步基于空间相关性对多通道音频进行分组,采用组内联合,组间并行的方式重建原始信号。此外,还通过充分的实验讨论了不同分组策略对联合重建精度的影响,并与非联合重建算法进行了对比。实验结果表明,本文提出的联合重建算法在所有通道的平均重建精度上,相对于非联合重建方法具有2-5dB的优势。
其他文献
房地产行业在经过多年快速发展后,伴随着贷款政策的收紧以及土地价格的持续上涨,以往通过土地的增值而取得收入的重资产模式陷入了困境。在这种背景下,为了脱离当前的困境并
“农村稳则天下安,农业兴则基础牢”,山东省农业经济发展总量居全国领先地位。从根本上来看,主要得益于农地产权制度变迁加速了农业要素禀赋和产业结构的调整与升级,农业内生
随着国内期货市场的蓬勃发展,期货市场的电子交易系统也层出不穷。在期货会员交易系统方面,日常的运维软件并没有得到相当的重视。针对这个情况,作者以某期货会员交易系统的运维软件的情况为样板,总结了运维操作的几种模式,并通过实际的工作情况,分析了这套系统存在的缺陷和问题。然后,作者针对上述的缺陷和问题,并结合其他需求,提出了一种新的模式——可扩展的、半自动的运维模式,力求做到通过简单的界面操作,可以帮助用
乙烯装置作为石油化工生产企业的关键装置具有非常重要的地位。在国内外,在评定化工企业规模时,我们常以乙烯生产能力作为重要指标,乙烯产量也是衡量一个国家的综合炼化工业
聚类和推荐系统的应用需要用户相似性这一参数,目前有多种方法度量用户的相似性,基于轨迹数据的方法是其中重要方法之一。随着位置获取技术的日益普及,例如GPS和Wi-Fi,大量的用户轨迹数据被获取,这使得该方法成为当前研究的热点。目前,大部分基于轨迹的用户相似性研究主要应用在社区网络领域,在物理世界的应用鲜见报道。校园网由于其用户的渗透性和多样性,是研究无线局域网用户行为模式的良好平台。在上述背景下,本
在公有区块链中,用来决定区块链网络中各个区块的签署权达成一致性认同的共识算法建立在奖励机制上,然而应用在非公有链的共识算法不适合建立在奖励机制上,因为在私有链和联
ADP-葡萄糖焦磷酸化酶(AGPase)是淀粉生物合成中的关键酶,由成对的两个大亚基(AGPL)和成对的两个小亚基(AGPS)组成的异源四聚体,分为胞质型和质体型两种,因此,在植物细胞内存在四类AGPase亚基:AGPase胞质型大亚基(AGPL1)、胞质型小亚基(AGPS1)、质体型大亚基(AGPL2)和质体型小亚基(AGPS2)。课题组前期研究结果表明,小麦淀粉合成基因TaAGPL1的过表达能
随着人们出行需求的增加和宽带多媒体业务的发展,越来越多的用户有着在高速移动通信场景下的通信需求。同时,由于高速移动带来的快速时变信道以及如高速列车特殊材料的车体带
供件Object Access Agent(OAA)是一种面向“物计算”的新型软件运行环境技术理念,提供了应用运行支撑环境与服务应用开发方法,可提高应用开发的重用性和扩展性。但OAA技术尚
本文以西藏革吉县嘎拉勒矽卡岩型铜金矿床为研究对象,在矿区地质填图(1:2000)基础上,结合前人研究资料,对该矿床地质特征和控矿条件进行了系统阐述,分析探讨了典型镁质矽卡岩的矿物学特征、成矿岩体的地球化学特征和岩石成因,查明了成矿流体性质和来源,厘定了成矿驱动机制,并初步建立了矿床的可能成矿模型。矿区内出露地层厘定为下白垩统捷嘎组白云岩和白云质灰岩,其下伏为下白垩统郎久组砂岩、粉砂岩和流紋质-英安