论文部分内容阅读
随着移动通信系统的快速演进,其空中接口的物理层信号处理技术不断更新,物理层信号处理对算法灵活性和处理器计算能力的要求推动了信号处理软硬件的联合发展。在硬件上,专用于通信信号处理的、支持软件编程的软基带专用指令集处理器(Application Specific Instruction Set Processor,ASIP)成为了物理层信号处理的一种合理的解决方案;在软件上,为了提高物理层算法的运算效率和系统误码率(Bit Error Rate,BER)性能指标,面向软基带ASIP的算法并行化成为了一种具有实际应用价值且不可忽视的软件技术。算法的并行化可以更加充分的利用ASIP的专用结构和专用指令集,通过数据级并行化(Data-Level Parallelism,DLP)和指令级并行化(Instruction-LevelParallelism,ILP)的方式,深层次地挖掘算法的并行度,成倍提高算法执行效率;或者利用并行化方式实现高性能、高复杂度的算法,提高移动通信系统的误码率性能指标。 面向软基带ASIP,从降低物理层链路处理时间和提高物理层误码率性能的角度出发,经过对OFDM(Orthogonal Frequency-Division Multiplexing,正交频分复用)通信系统链路在软基带ASIP上实现的分析,本文选取了其中具有关键性、耗时、且存在并行化难度的算法模块——ZC(Zadoff-Chu)信号产生、信号卷积(Convolution)和多输入多输出(Multiple-input Multiple-Output,MIMO)系统对数似然比(Log Likelyhood Ratio,LLR)产生算法作为主要研究内容。结合软基带ASIP的单指令多数据(Single InstructionMultiple Data,SIMD)和超长指令字(Very Long Instruction Word,VLIW)结构特点,对算法进行了深入研究和并行化设计。 针对ZC信号的产生,本文提出了一种基于根指数分解和少量种子序列组合的并行化算法,消除了ZC信号离散傅里叶变换(Discrete Fourier Transform,DFT)计算中的采样操作,并对种子序列的个数和长度做出优化,获得了良好的并行计算结构。ZC信号及其DFT的并行化产生算法在软基带ASIP上的计算效率分别达到了并行化抽样算法的4.8倍和4.6倍,而存储开销虽增加25%(4.7KB)和75%(14KB),完全满足软基带ASIP的片上存储容量限制,另外在工程上没有计算精度损失。该并行化算法已经应用于中科院计算所LTE(Long Term Evolution)基带SoC(System on a Chip)芯片。 对于信号卷积算法,本文分别提出了基2和基4的并行化短卷积算法,同时提出了基2和基4的专用并行化卷积指令,并通过VLIW结构对卷积的Overlap做出有效的计算处理。不同于传统并行化卷积算法的直接计算结构,本文提出的算法采用了并行短卷积计算结构,在软基带ASIP上具有极高的计算效率,基2和基4算法分别能够达到传统外循环矢量化(Vectorizing the Outer Loop,VOL)算法时间效率的2.5倍和4.3倍,并且在存储空间开销上能够与其基本持平,计算精度没有损失。与业界的专用数字信号处理器(Digital Signal Processor,DSP)中的专用算法相比,本文提出的并行化卷积算法指令周期的时间效率分别为TI C66x专用算法的1.5倍和2.8倍,达到业界先进水平。 对于MIMO系统LLR产生算法,本文提出了一种并行化半固定树搜索算法,利用Counter-ML路径权重进行LLR的计算,该算法利用符号调制中格雷映射(Gray Mapping)的特点和Schnorr-Euchner搜索策略,形成确定的运算量和规则的数据流,使得所有OFDM子载波的计算过程完全相同,从而能够以并行化的方式实现。本文提出的算法在2*2 MIMO和4*4 MIMO的条件下,不同符号调制方式下的误码率性能分别优于Bit-Flip算法2.6dB~3.9dB和2.3dB~2.6dB,时间复杂度则相应提高20%~40%和60%~90%,且能够在软基带ASIP的计算能力下完成算法执行。并行化LLR产生算法获得了良好性能和复杂度的平衡,使得高性能算法能够以较少的时间复杂度增加为代价在软基带ASIP上完成计算。 为了验证上述并行化算法的性能,本文基于软基带ASIP,利用提出的并行化算法对典型的OFDM移动通信系统物理层链路进行评估。结果表明,本文提出的算法能够获得链路级的总体耗时降低和误码率性能提升。一方面,本文提出的并行化算法在软基带ASIP上的实现具有极高的计算效率,对于2天线和4天线的数据发送过程,利用本文提出的并行化ZC信号产生和并行化卷积算法对原有并行化算法进行改进,链路总体耗时降低为原来的48%和46%;对于2*2 MIMO和4*4 MIMO的数据接收过程,利用本文提出的并行化ZC信号产生、并行化卷积和并行化LLR产生算法对原有并行化算法进行改进,链路总体耗时降低为原来的63%和79%;对于同步过程,利用本文提出的并行化ZC信号产生和并行化卷积算法对原有并行化算法进行改进,链路总体耗时降低为原来的29%。另一方面,本文提出的并行化算法能够将高性能、高复杂度的算法在软基带ASIP上的实现变为可能。针对2*2 MIMO和4*4 MIMO的天线配置,利用本文提出的半固定并行化LLR产生算法,能够在接收链路总体耗时仍然降低的情况下,数据接收过程的总体误码率性能分别提高了2.6dB~3.9dB和2.3dB~2.6dB。 综上所述,本文提出的ZC信号产生并行化算法、信号卷积并行化算法和MIMO系统LLR产生并行化算法对于移动通信系统中物理层信号处理在软基带ASIP上的实现具有重要意义和应用价值。