基于最短路径策略的分层聚类方法研究

来源 :中国民航大学 | 被引量 : 1次 | 上传用户:l_zhijie1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据分析的一种基础操作。聚类算法由于聚类过程和结果形式的不同,分为划分聚类和分层聚类两大类。因为分层聚类算法使用树型结构表示结果,其包含的信息量更大,并且不需要用户提供任何参数,由此可见分层聚类算法具有一定的优势。但在实际应用中,由于分层聚类算法的过程是确定的,如果在算法执行过程中某一合并或分裂操作不当,就会导致错误的聚类结果,从而影响聚类的准确性。近几年,计算机界出现了一种解题的新思路,将目标问题转换为最短路径问题,再借助求解最短路径问题的思路求解目标问题。因此,本文借鉴了求解最短路径问题的思路对分层聚类算法进行了深入的研究。首先,分析现有的聚类算法,通过对分层聚类算法与划分聚类算法进行比较,剖析了分层聚类算法的优势和不足之处;并研究现有的路径搜索算法,分析搜索算法的优缺点。其次,为了解决分层聚类算法中不能回溯的问题,提出了一种基于最短路径策略的分层聚类算法(Shortest path hierarchical clustering algorithm,简称SPC)。其基本思想是首先将分层聚类问题转换为一个最短路径问题,然后通过A~*(A-Star,简称A~*)算法的搜索策略来求解该最短路径问题,进而达到对分层聚类问题的求解。通过理论分析和模拟实验,验证了SPC算法相对于DNA简约算法(DNA parsimony program,简称DNAPARS)在运行效率和准确性上都有提高,说明SPC算法具有一定的优越性。再次,由于当数据量较大时,SPC算法所需的运行时间比较长,针对此问题,提出了一种基于CUDA(Compute Unified Device Architecture,简称CUDA)加速的SPC算法(Shortest path hierarchical clustering algorithm based on CUDA accelerated,简称cudaSPC)。其主要的工作是利用GPU(Graphics Processing Unit,简称GPU)硬件并行地扩展多个节点。在模拟实验中,通过与SPC算法进行比较,结果表明cudaSPC算法在准确性不变的情况下,提高了算法的执行效率。最后,对全文进行了概括,并对将来的研究工作进行了展望。
其他文献
自司马迁开创了纪传体,史家纷纷沿用。东汉以后,纪传体已超过编年体而居主导地位。唐初设馆修史以来,纪传体史的发展呈一枝独秀的局面。班固改通史为断代,陈寿创纪传体国别史
凭着对新科技、新技术的追求,他闯出了一条依靠科技、勤劳致富的成功之路;他致富不忘众乡亲,主动帮扶困难职工脱贫致富,受到职工群众的赞誉。他就是一师十一团六连共产党员高
1997年6月30日,回归前一晚的香港风雨大作。现任香港特别行政区第6届立法会主席梁君彦回想起20年前犹如昨日一般。他回忆道,6月30日晚上,英国人在香港作了告别仪式。23时59分,随
2019年1月9日至11日,中华全国总工会书记处书记、党组成员许山松率全总“送温暖”慰问团一行赴兵团开展送温暖活动,在兵团期间走访慰问困难职工、困难劳模和困难企业,为他们
今年51岁的冯新云是七师一三○团育才路社区的一位普通居民,她患有乳腺癌,曾动过两次手术,可她硬是坚强地挺了过来,现在的她性格乐观开朗,爱说爱笑,不但担任了楼栋长、志愿者
随着反舰/反潜武器的多样化和更新换代,舰船面临着越来越大的毁伤威胁,如何在舰船设计阶段快速有效地评估来自反舰/反潜武器的毁伤效应就显得十分关键。本文主要研究了水下非
现在中央教育部根据苏联的先进经验,将新的高初中物理课程教学大纲(草案)制定。其中指示初高中物理教材的内容,范围和组织系统,教学中理论与实践联(?)底原则和教授的法则,以
低空目标的中、近程探测是当前紧迫的研究课题之一.文中主要对低空、超低空的悬停直升机和巡航导弹的理论模型进行信号仿真,同时提出相应的检测方法,并在不同信杂比条件下用M
一“美育”是一个历史的概念,它的意义应该随着历史的发展而不断变化,并赋予其新的意义。早在公元前五世纪,当人类刚刚迈入农耕社会之时,我们的古代圣贤就提出了“艺术教育”的问
抚触具有达到促进婴儿身心发育,提高免疫力及增加舒适度的效果。本文从促进婴儿生长发育作用、改善新生儿黄疸两个方面总结了婴儿抚触的临床应用效果,探讨了婴儿抚触技术的操