论文部分内容阅读
随着图像采集设备的快速发展,高分辨率图像带来了极大的数据处理量,此外多样且复杂的算法则带来极大的运算量。为了实现对图像的快速、智能化处理,要求图像处理平台有较高的处理性能和较低的功耗,而高速、高性能DSP是实现快速处理的关键。基于提高图像处理平台性能的目的,本文重点研究多核DSPTI-C6678,以期解决高性能和低功耗的均衡问题,构建并行框架以发挥出多核性能优势,推动高性能图像处理系统的实现。论文以充分发挥TI-C6678多核性能为出发点,分别从以下几个技术环节开展了深入研究。第一,分析其多核原理和架构优势,提出存储器配置应用方法,从底层访存角度提升内核访问效率。同时,对资源共享和中断管理机制进行研究,目的是增强多核系统的协调性和灵活性。第二,针对TI-C6678多核并行处理的核间同步与通信关键因素,研究四种核间同步与通信方式,依据各自优劣分析核间同步与通信的最优应用场景。第三,针对图像处理对存储器间大数据的快速交互需求,研究基于DMA技术支撑的存储器间大数据高速交互应用方法,避免内核执行数据搬移而屏蔽算法指令的执行,能实现无内核参与下的GBps级的数据搬移性能,同时兼顾灵活性和高通信带宽优势。第四,考虑到图像处理平台对多核Boot启动的工程需求,研究和实现SPI方式的自举启动,以批量处理方式简化多核镜像融合工具链。同时考虑到网络通信扩展要求,实现基于TCP/IP协议的网口通信,达到实时网络通信性能,有利于平台数据交互接口的多样化。最后,针对TI-C6678图像处理系统的多核开发环境,研究主从和数据流模式的多核开发架构,分析两者的实现机制和核间同步与通信方法,提出多核开发架构的应用环境以便图像处理算法选择合适的开发架构。结合以上分析,在存储器配置应用方法、高速数据搬移和核间同步机制等研究成果的基础上构建了高速的多核DSP串行、多核DSP并行图像处理应用框架。多核串行框架采用顺序处理结构,有较大的时间损耗,不能充分发挥出多核性能优势。多核并行框架则改进了串行方式的核间前驱触发机制,创新地使用后驱机制来触发内核同步工作。内核并行执行图像处理算法同时解决了数据覆盖问题,内核利用效率得到提升,有力的压缩了总任务处理时间,从而达到提升图像处理性能的目的,具有较强的高速实时处理性能。同时,该框架具有较好的扩展性和较大的性能提升空间。