【摘 要】
:
在现代处理器中,具有向量处理单元的VLIW体系结构已经逐渐成为高性能数字信号处理器(Digital Signal Processor,DSP)的典型代表。这类结构具有寄存器资源丰富、执行单元多等特点,对其在DSP算法程序代码的编译时施加循环展开优化能更好地利用硬件资源来提升代码的性能。循环展开的效果主要取决于所选择的循环展开因子,但是传统的循环展开因子选择方法对硬件资源特征的考虑有限,不能更好地发
论文部分内容阅读
在现代处理器中,具有向量处理单元的VLIW体系结构已经逐渐成为高性能数字信号处理器(Digital Signal Processor,DSP)的典型代表。这类结构具有寄存器资源丰富、执行单元多等特点,对其在DSP算法程序代码的编译时施加循环展开优化能更好地利用硬件资源来提升代码的性能。循环展开的效果主要取决于所选择的循环展开因子,但是传统的循环展开因子选择方法对硬件资源特征的考虑有限,不能更好地发掘向量DSP代码的指令级并行性。为了改善循环展开处理的效果,本文针对向量DSP的特点研究了循环展开问题,建立了一种内层循环展开方法,提出了相应的循环展开因子选择算法和相关的支撑算法。本文的工作主要包括以下三个方面:1)内层循环展开因子选择算法VCLUF。考虑向量DSP体系结构的寄存器资源多类异构、执行单元多等特点,构建了一种内层循环展开因子选择模型并研究了确定相应循环展开因子值的算法。该算法重点考虑了循环体代码的标向量属性、基址寄存器和索引寄存器资源使用规则等因素,并且增加了执行单元使用占比这个启发式因素。对于内层循环代码中主要是向量处理指令或标量处理指令的情况,实验表明该算法能找到更合适的展开因子;2)面向标量向量综合代码的内层循环展开因子选择算法SVCLUF。通过将向量处理单元和标量处理单元配合使用的DSP算法程序可以得到更好的代码性能。本文在VCLUF算法的基础上,考虑循环体中既有标量处理代码又有向量处理代码的情况,进一步提出了SVCLUF算法来确定标量向量综合代码的内层循环展开因子。该算法通过进一步区分硬件的标量资源和向量资源对循环展开因子选择的影响,建立了改进的处理模型。实验表明该算法能为具有标量向量指令综合代码的内层循环找到更合适的展开因子;3)循环体代码信息分析和循环展开处理。为了提供支撑循环展开因子选择算法执行时所需的信息,本文设计了循环体代码信息分析算法来分析内层循环代码中各指令的标向量属性及执行单元类型、所包含的变量和不变量与寄存器类别的对应关系。此外,基于信息分析算法以及上述VCLUF和SVCLUF算法,针对向量DSP的结构特点改进了相关的循环展开子算法,从而形成完整的循环展开处理方案。这些子算法主要包括区分归纳变量的标量或向量属性的识别算法和处理算法,以及移植的循环展开版本生成算法、尾循环生成算法、寄存器重命名算法。
其他文献
随着意见挖掘和情感分析在学术界和工业界受到广泛关注,以及诸如Jingdong和Taobao等电子商务的日益普及,产生了大量的用户评论文本,为科学研究带来了宝贵的资源。这些海量的评论文本中,包含了用户对商品、服务等表达的观点,这些评论信息能够成为生产者提高产品、服务质量的宝贵资源,具有非常大的商业价值。然而评论数据的指数级增长,导致人工无法从海量的数据中获取到有用的信息。已有的研究表明,基于深度学习
随着各大手机应用商店的移动应用快速增长,用户难以选择合适自己的移动应用。因此很有必要提供高质量的移动应用推荐机制,从而提升用户的良好体验。现有的移动应用推荐方法存在移动应用文本表征不够精确、忽略了移动应用的原始特征权重以及未考虑到用户与移动应用的深层次交互关系。为此,本文在内容层面提出两种大众化移动应用推荐方法,在用户交互关系层面提出一种个性化推荐方法用以解决上述问题。更具体来说,本文的研究内容如
传统导引头整流罩是一个同心的球面罩,这种整流罩的像差易校正,但给导引头带来很大的气动阻力,难以满足现代导引头的发展需求。共形整流罩是一种新型整流罩,它与飞行器气动外形更加匹配,能够提升导引头空气动力学性能,所受到的阻力相对于球形整流罩也大幅度的减少。但是,共形整流罩通常会产生大量的动态像差,随扫描角度的变化而变化,严重影响了光学系统成像质量。因此,共形整流罩光学系统遇到主要设计困难在于如何校正动态
为实现企业健康可持续发展,许多企业开始探索轻资产运营投资,在规避资金运营风险的同时,最大程度拓宽自身效益空间。本文通过分析轻资产及轻资产运营投资战略的内涵价值,指出企业轻资产运营投资战略风险及形成原因,最后从三方面入手提出具体的实施要略,包括完善投资管理机制、加强可行性分析及监督、全面权衡项目合作风险。
分类是数据挖掘中常见的一个任务。经典的分类算法通常是应用在数据集中各类别大小趋于平衡的情况下。随着数据时代的发展,各个应用的数据量在快速增加。在一些应用中数据的增加不是同步的。某些类别数据增加十分迅速,而某些类别的数据增加并不明显。这样会造成数据类别不平衡的情况。传统的分类算法在分类时会偏向多数类数据。因此,有必要对不平衡数据进行更进一步的研究。在分类任务中,并不是所有的数据对分类都起到贡献作用,
近年来,随着智能终端设备的快速增长,数据流量呈现爆炸式增长,给移动网络的架构带来极大的压力。移动边缘计算(Mobile Edge Computing,MEC)的出现,可以在移动网络边缘部署计算、存储服务,从而实现业务的就近处理。移动边缘计算中的缓存技术,通过在边缘节点来缓存文件以分担移动核心网络的压力,目前已成为一种经济高效的解决方案来减轻网络拥堵、满足用户体验质量(Qo E)。移动边缘计算缓存策
近年来,学术界在清代新疆灾害史这一领域取得了显著的成果,各类灾害的发生频次、灾因、灾害发生规律及应灾机制等一些基本问题得到了梳理。汇总与统计了清代新疆灾害史料,评析了近30年来的研究成果,认为当前该领域的研究还存在研究不平衡、对新疆地区的特殊性关注度不够等问题,需要进一步对史料充分发掘与利用,加强多学科之间的交流与借鉴,以期在研究上取得一些具有代表性的成果,获得在理论上的突破。
洪旱灾害是新疆主要的气象灾害,历来对农牧业影响较大。当代以来在中国共产党的领导下,新疆维吾尔自治区党委和各级行政部门十分重视防范应对各类自然灾害,采取相应措施,取得了有效的成就。本文梳理了1949年以来新疆洪旱灾害研究成果,分别从研究成果论著、发表论文、学位论文等几个方面来反映洪旱灾害研究的进展及主要成就。用历史的眼光重新梳理前期研究成果,作整体的回顾、反思,为进一步加强抗旱防洪研究和生态文明建设
表面增强拉曼散射(SERS)作为一种准确、灵敏、高效的检测方法,已经被广泛应用于各种分子的痕量分析,观察拉曼光谱中独有的特征峰强弱可以对分子实现精确定量。目前普遍的SERS检测主要围绕在液体中的有机分子上,而气体分子拉曼由于散射截面小,信号弱,对其进行高灵敏度的SERS检测十分困难。本文针对目标气体分子NH3的高灵敏度定量成分识别问题,从材料选取合成,基底设计加工和SERS测量方式上出发,制备了一
伪狂犬病(Pseudorabies,PR)是由伪狂犬病毒(Pseudorabies virus,PRV)引起的急性传染病,可导致多种家畜和野生动物出现发热、奇痒(猪除外)及脑髓炎等主要症状。猪是PRV的主要宿主和传染源,仔猪感染后主要表现为神经症状,哺乳仔猪死亡率可达100%,妊娠母猪感染后可导致流产、产死胎和木乃伊胎,是严重危害我国养猪业的一个重要传染病。疫苗免疫是防制伪狂犬病的主要措施,目前P