基于TI6678的OpenCV移植与并行优化

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:cupcome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信号处理器(DSP)广泛应用于各类工业领域和军事装备领域,OpenCV是业界通用的开源图像处理算法库,但目前鲜有针对DSP平台的OpenCV移植和并行优化实现。移植OpenCV到DSP能够降低DSP图像应用开发的难度和准入门槛,提高DSP图像应用开发的效率,对军事图像处理应用的扩展具有推动作用。本文实现的OpenCV图像处理库已经成功在飞腾某型号芯片上进行了光斑跟踪检测的快速开发应用。本文在TI公司TMS320C6678 DSP平台上(以下简称为TI6678)实现了OpenCV的移植和优化。单核运行性能方面超越TI在AM572x EVM和66AK2H EVM上使用ARM+DSP的组合运行Linux实现OpenCV的解决方案。在单核优化的基础上,本文还结合OpenCV并行支持和TI6678的并行支持的特点,提出了结合OpenMP和OpenCV的并行方案,并且还提出了可以并行的OpenCV函数在TI6678上实现并行优化的一般方法。通过选取数个OpenCV函数进行并行改造,实现多核加速,证明修改方法的有效性。再者,本文发现了TI6678上运行OpenMP的性能瓶颈。从TI6678的OpenMP单核程序执行效率比单核CCS程序慢的现象入手,分析了TI6678上OpenMP程序控制过程,通过设计实验得出控制部分相对访存计算耗时很小的结论。而后分析OpenMP实现过程,得出写直达可能是影响性能发挥的因素,并通过访存实验,证明了这一推断。最后本文提出了IPCMP的并行方法,在OpenCV的并行层次中替换了OpenMP的支持,实现了OpenCV上自定义的并行方式。通过分析可以隐藏或者不考虑共享存储访问的Cache一致性的OpenCV函数的特征,证明了这部分函数不使用写直达并行的可行性。结合TI6678上的核间通信和共享存储管理特点,在函数的访存块不超过四片情况下,使用本文提出的IPCMP的OpenCV程序多核并行的性能比TI6678上使用OpenMP支持的OpenCV函数性能有了大幅提升。同时相比TI提供的ARM+TI6678的解决方案有明显的性能优势。
其他文献
目的:观察二甲双胍分别联合瑞格列奈或格列吡嗪控释片、α-糖苷酶抑制剂治疗2型糖尿病的临床疗效和安全性.方法:选择2009年1月至2010年5月我院门诊及住院的初诊2型糖尿病患者11
2002年12月上旬,到德国巴伐利亚垃圾处理研究所进行了考察.该研究所成立于1991年,位于德国巴伐利亚州府慕尼黑附近的奥斯堡市,以必发有限责任公司名义成立,又叫巴伐利亚环境
"罗钾"是国内硫酸钾行业毋庸置疑的领军企业。近几年,中国硫酸钾行业产能产量均有大幅增长,基本满足了国内硫酸钾的需求。其中,国投罗布泊钾盐有限责任公司120万吨钾肥项目的建
目的:探讨多层螺旋CT肺动脉血管成像(Multi-slice spiral CTpulmonary angiography,MSCTPA)技术在肺动脉栓塞(PE)诊断中的价值。方法:收集临床怀疑为PE并经MSCTPA检查确诊的25例患
河南农业职业学院全体教职员工:丹香欲染,秋菊溢彩。在第二十九个教师节即将到来之际,我谨代表河南省农业厅,向河南农业职业学院全体教职员工和离退休老同志致以节日的祝贺和亲切
在介绍WCL-13A调节仪特点和基本规格的基础上,着重介绍了串级控制技术和WCL-13A这种新型调节仪在太阳能电池制造中的扩散炉温度控制等场合的应用案例。
2013年3月至4月,中国照明电器协会对国内10家主要灯具市场进行了调研,所调研的灯具市场年总销售额超过200亿元人民币,其辐射范围几乎涵盖全国。$$ 本文对所调研灯具市场的现
报纸
基于风险的检验(Rick-Base Inspection,简称RBI),是现代计算机技术、设备安全评价技术、材料损伤机理研究技术、失效分析技术以及设备检验技术等不断发展进步衍生的一种在役
就如何在城市燃气公司通过信息化建设,以提高行业管理水平,为宏观管理者提出了很有价值的建议。
为解决微定位平台大行程与高精度之间的矛盾,本文设计一新型柔性精密微动平台,并利用螺旋理论对其进行相应的运动特性分析。该柔性微动平台是将三个柔支链构分别作用于工作台