论文部分内容阅读
修正离散余弦变换(Modified Discrete Cosine Transform, MDCT)能高效和紧致的表示信号,因而广泛用于各种感知编码(PerceptualAudioCoding,PAC)。但作为临界采样的实重叠变换,MDCT能量不守恒,无相位信息,难以直接分析和处理信号。由于这个限制,PAC向低码率发展时,引入独立的复变换用于低码率参数编码模块的信号分析和处理。然而引入独立变换增加了复杂度与算法延时,这两者又都是移动通信系统的重要指标。如果MDCT还能高效的分析和处理信号,那么就可以避免这两个问题。这是论文研究MDCT域信号处理的主要动机。在论文中,我们研究了MDCT与DFT的对应关系、正弦信号MDCT频谱特性,以及完全MDCT域低码率参数立体声编码。论文的主要贡献包括:(1)提出循环重叠变换(Circulant Lapped Transform, CLT),以此为桥梁得到MDCT-DFT转换矩阵的稀疏表示以及复杂度为O(N)的快速转换算法;(2)发现并证明正弦信号MDCT奇偶子频谱的线性相关性,提出奇偶子带划分法,对一般音乐信号最高有20dB的编码增益;(3)给出任意窗函数下正弦信号MDCT频谱的严格表达式,突破现有理论对窗函数的限制,得到适用任意窗函数的频率幅度估计方法,2到3次迭代达到机器精度;(4)提出最大相关度旋转(Maximal Coherence Rotation, MCR)变换,在正交变换下最大化子带信号对的相关度,并给出MCR参数与双耳线索参数的等价关系;(5)构建基于奇偶子带划分和MCR变换的MDCT域参数立体声编解码器MDCT-PS,与MPEG-4参数立体声(Parametric Stereo, PS)相比,复杂度降低43.9%,延时降低20ms,音质相当。综上,论文工作不仅将MDCT从一种信号表示工具拓展为一种高效的信号处理工具,还提供了低复杂度低延时立体声编码的可行方案。