全搜索算法的SSE并行优化

来源 :微计算机应用 | 被引量 : 0次 | 上传用户:lpcumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于宏块划分的视频编码算法中,运动估计阶段因为其庞大的计算量占用了绝大多数的编码时间。特别是在对高清视频进行编码时,运动估计已经成为提升编码性能的最大瓶颈。本文通过对全搜索运动估计算法进行基于像素的并行化修改和优化,使用SSE指令调用CPU的SIMD单元同时对当前宏块与参考宏块的多个像素进行SAD运算,对运动估计进行了并行化的实现。在相同的硬件环境以及保证编码质量的前提下,相对于传统的全搜索CPU运算获得了2倍以上的编码性能提升。
其他文献
几何产品形位误差的计算是机械制造领域中的关键问题,属于非线性优化问题,应用遗传算法的全局优化能力实现了对误差问题的精确求解。重点研究了算法的实现技术,包括统一计算模型
将contourlet变换和多级离散小波变换的"多级"概念引入到离散余弦变换中,并针对当前传统的离散余弦变换域水印算法不能有效旋转几何攻效抵抗击行进了特性的分析和改进。在此基
2013年,随着云计算、大数据、物联网、移动互联网以及智能终端等新兴信息技术的蓬勃发展,和国内外网络信息安全形势的日益严峻,“人机物”三元融合的程度更高、领域更广、影响更
论文结合具体事例,分析了数据库领域内最常用的ER模型和关系模型,并详细介绍了从关系模型到ER模型的转换算法。算法的关键是通过牺牲时间复杂度的代价,遵循特定的转换顺序,将
在对指纹匹配算法进行了深入研究及总结现有算法优缺点的基础上,提出了新的基于扇区划分的细节点采样指纹匹配算法。本算法以指纹图像参考点为中心,分扇区对细节点数目进行采样统计以构造新的指纹特征向量,再利用距离最小准则进行指纹匹配。实验结果表明,本算法有效提高了指纹图像的匹配效果和运行速度。