数据图处理系统中非确定性并行执行模型的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:songyonghuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中实体间的关系可以图数据来表示。图算法用来对图数据进行数据挖掘。数据图处理系统提供了接口给用户实现图算法。数据图处理系统执行算法时普遍采用确定性的并行执行模型,这会导致算法执行并行度低和系统可扩展性差的问题。非确定性的并行执行模型没有这些缺点并能提升系统性能,但是由于当前研究没有说明非确定性并行执行模型的正确性和适用范围,使得它很少被使用。本文针对非确定性并行执行模型因为缺少理论支持而应用不足的问题,给出并论证了非确定性并行执行模型的正确性、适用范围和性能的相关理论。数据图处理系统中非确定性并行执行模型的研究,首先对图处理系统的一般运行过程进行建模,并对算法执行提出保证数据读写原子性和保证数据访问一致性两个限制条件。在系统模型和限制条件的基础上分析不同算法发生数据竞争后可能的执行过程和结果,证明图路径遍历算法能修正读写竞争和写写竞争,图固定点遍历算法能修正读写竞争,然后以外部确定性调度和SSSP算法为典型,通过计算算法在外部确定性调度执行模型和非确定性执行模型下收敛速度的期望,说明算法在不同执行模型下迭代次数大致相同。实验在一个典型的数据图处理系统GraphChi上实现了非确定性并行执行模型,并用标准的图算法和图数据进行了测试,通过将非确定性并行执行模型与确定性并行执行模型下的实验结果进行比较,证明在非确定性并行执行模型下算法迭代次数变化不大,运行时间大幅减少(利用体系结构保证原子性的实现方案性能最好,最多能减少70%的运行时间)。算法运行时间随着处理单元增加而递减,说明非确定性并行执行模型具有良好的可扩展性。实验还对不同执行模型下图固定点遍历算法的输出结果进行对比和分析,说明非确定性并行执行模型下图固定点遍历算法结果的正确性。
其他文献
学位
随着教育体制的改革,提高全民素质,高校招生名额每年以30%的速度递增。而各个高校在原有的硬件,软件条件下,学生人数都不同程度的按比例增加,为了保证教学质量,最大程度的发挥软硬件
数据挖掘技术是一个从大量数据中发现潜在知识的过程,其主要目的就是从大量的、不完全的、有噪声的应用中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识。
计算机集群系统是通过高速网络将一组PC或工作站连接起来构成的高可靠、可扩展的服务器系统。集群中各PC或工作站通过统一调度、协调运行达到高效并行处理的目的。Beowulf集
超椭圆曲线密码体制作为椭圆曲线密码体制的一个推广,它的安全性是建立在超椭圆曲线离散对数问题难解性上的。与其他公钥密码体制(如RSA/ECC)相比,它的密钥长度更短、安全性
动态图像理解技术在智能交通中应用的研究,是智能交通系统的重要前沿研究领域,具有十分重要的理论意义和应用价值。利用基于动态图像理解技术在道路交通方面的应用代表着道路交
以Android为代表的现代移动操作系统在为移动应用提供稳定、高效运行环境的同时,存储、管理着相对于个人计算机更多的用户隐私数据。为获取更优质的服务,用户通常不吝啬于向
计算空间任一点到多面体的有符号距离在众多领域都有应用,如在虚拟现实,机器人运动规划,碰撞检测等方面都有应用。经常通过计算物体间的最近距离来避免运动过程中的干涉和碰
在能源枯竭与环境污染日趋严重的背景下,太阳能作为一种清洁的可再生能源以其资源丰富、分布广泛和开发前景广阔的优点,愈来愈受到了世界各国的重视。而光伏发电是太阳能目前使
本文提出了一种改进的向量空间模型(VSM)用户单兴趣表示法及其动态学习算法,实验表明该算法能够实时捕捉和记录用户最新的兴趣需求,并能自适应地调整和更新用户模板。在此基