基于FPGA的细粒度并行K-means算法加速器的设计与实现

来源 :2009年全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:flexhansen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在深入分析K-means算法计算特征的基础上,基于FPGA平台提出并实现了一种细粒度的并行浮点K-means算法。设计采用了阵列多PE并行处理的任务划分策略,实现了处理单元间的负载平衡,采用数据驱动的流水线隐藏片外存储访问,设计了一种基于脉动阵列结构的主从多PE并行计算阵列,并在单片FPGA(XC5VLX330)上成功集成了4个PE。实验结果表明,提出的K-means算法加速器结构具备良好的可扩展性。通过实验测试,我们的实现方案相对于Pentium 4 2.66 GHz单处理器程序达到了15倍的加速比。
其他文献
目标区域主轴能够描述局部形状信息,区域扫描线算法可以遍历目标区域内部任意点。本文在分析区域主轴算法与扫描线算法的基础上,提出了根据区域主轴与垂直于主轴的区域内部扫描线长度、位置分布来描述目标形状的方法,并通过构建基于主轴的归一化弦长度分布直方图实现了目标区域形状的有效匹配。实验仿真结果表明,算法可以准确有效地描述目标形状,并具有位移不变、旋转不变和一定的尺寸不变特点,可以用于目标形状识别与内容检索
星载GPS非差运动学定轨结果容易受到观测数据质量的影响,相位观测噪声远远小于伪码,如果将两种观测数据等权处理,会降低相位信息在参数解算中的作用;相位观测存在模糊,单独使用会导致参数估计结构不稳定;伪码观测噪声与接收天线高度角存在很强的相关性。本文根据星载GPS伪码和相位联合非差运动学定轨原理,结合GPS观测数据质量分析结果,提出了一种合理的加权策略,提高了星载GPS非差运动学定轨的精度和稳定性。对
大学对于学生最主要的意义是扩大眼界、提高见识,使人拥有更丰富的内心世界和更高洁的人生境界,有丰富的不断超越自我的内在动力。因此,大学首先要带给学生的是现代文明的教养;其
针对FP-growth算法存在动态维护复杂、在挖掘过程中需要递归地创建大量的条件频繁模式树,导致时空效率不高等不足,本算法在压缩前缀树的基础上,通过调整树中节点信息和节点链
虚拟样机工程的复杂性不断增加,需有科学的项目管理技术来实现高效组织与管理。在工程项目资源均衡优化的调整中,通常以资源方差来衡量资源的均衡性,方差越小资源均衡性就越
多媒体以图文并茂、声像俱佳、动静皆宜的表现形式,以跨越时空的非凡表现力,大大增强了人们对抽象事物的理解与感受力,从而将课堂教学引入了全新的境界。一节节计算机辅助教学(C
随着我国社会的高速发展,城市面貌日新月异。很多既有建筑在新的城市规划中被划入了需要改造的范围。其中,既有建筑消防系统的改造是整个改造过程的重要组成部分。但在消防系
  应用塑性变形理论,利用精密挤压技术原理和热处理理论。研究出一种适合大批量生产,质量稳定可靠的加工工艺,来满足该产品批量生产的需求。通过塑性变形程度计算,工装设计、改
介绍电捕焦油器投产后,硫酸铵工段的母液系统产生大量泡沫,致使饱和器的操作发生困难,分析产生泡沫原因,采取措施,并取得预期效果。