基于图模型的聚类算法研究

被引量 : 0次 | 上传用户:puzz777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展和网络资源信息的日益丰富,海量互联网网页同时涵盖文本、图像、视频和音频等媒体数据以及多种语言并存,呈现出跨媒体的特性。如果缺乏一套有效的检索机制,从海量的跨媒体资源中搜寻信息无疑是大海捞针,因此,研究海量信息的跨媒体检索机制至关重要。一般而言,用户需要的检索信息并不直接存在于被检索资源中,而是需要搜索引擎对潜在的检索结果作诸如摘要生成、分类、排重、聚类等智能处理,才能满足用户的检索需求。本文在广泛阅读相关文献、深入了解聚类算法的原理与应用的基础上,主要针对基于图模型的聚类算法,在算法的改进、应用上做了如下工作:1.结合基于因数图的仿射传播聚类算法和k-中值多数投票算法的优点,提出了使用松弛多根最小生成树分配算法的投票分割式仿射传播聚类算法,实验结果证实了该算法的有效性。2.提出了一种基于随机分块和投票聚类融合策略的聚类大规模数据集合的算法框架,并使用该算法框架对仿射传播聚类算法进行了扩展,使其能够处理任意形状的更大规模的数据集合,并验证了该扩展的可行性和有效性。3.对聚类分析在图像搜索领域的应用进行了探索,提出了一个基于投票分割式仿射传播聚类算法的图片搜集模型。本文的贡献和创新主要体现在算法的改进和应用上:1.提出了分割式仿射传播聚类算法,它在实际聚类个数大于本质聚类个数时能在本质聚类上产生随机的划分,从而使其满足投票策略对聚类生成器的随机性的要求。2.提出了松弛多根最小生成树分配算法,在基本保持聚类结果的随机性的基础上,减小了误分配的概率。3.将使用松弛多根最小生成树算法的分割式仿射传播聚类算法和投票策略结合在一起,并结合划分一致性索引指标讨论了如何选取合适的域值参数的问题。4.提出了一种将时间复杂度和空间复杂度较高的聚类算法扩展到大规模数据集合应用上的算法框架——随机分块再融合,并用其对仿射传播聚类算法进行了扩展,使其能处理更大规模的、任意形状分布的数据集合。5.提出了一个基于投票分割式仿射传播聚类算法的图片搜集模型,使开发人员能够基于此模型构造一个应用程序来帮助用户从现有图片搜索引擎上方便的获取相关主题的图片资料集合。
其他文献
<正>在数据后集中时期,银行生产运行管理和维护服务被提到重要位置。ITSM作为一种全新的服务平台和服务体系,被广泛应用在各大型企业和金融服务行业。中国农业银行引进ITSM,
<正>有句话叫"有调查,才有发言权"。我们都知道,在保护儿童乘车安全方面,儿童安全座椅是行之有效的安全装备。在家长安全意识逐步提升的今天,国内儿童座椅的使用率究竟能达到
查明案情、惩罚犯罪,以实现实体公正是当今世界各国共同的诉讼目标之一,为了实现这一目标各国纷纷采取各种措施,法官庭外调查制度无疑有利于达到这一目标,然而就是这样一种制
<正> 人们不喜欢建筑丑。建筑师搞创作力图避免建筑丑。建筑杂志迄今还没有发表过专门谈建筑丑的文章。出版社更不出版研究建筑丑的专著或图集。美学界的情况也有类似之处:虽
目的观察老年患者一次法根管治疗术约诊间急症的发生情况,探讨一次法根管治疗适应证范围。方法对2010年至2012年就诊于遵义医学院附属口腔医院牙体牙髓科,一次法完成根管治疗
<正>2014年底,C-NCAP发布了首批24款儿童安全座椅的评价结果,引起广泛关注。儿童安全座椅根据孩子的身高体重分为婴儿组、幼儿组和学童组3个组别,为避免在孩子成长过程中频繁
目的探讨沙美特罗替卡松气雾剂治疗儿童支气管哮喘的临床效果。方法选取我院收治的84例支气管哮喘患儿作为研究对象,将其随机均分为实验组和对照组,对照组采用氟替卡松气雾剂
目的:1.探寻古方黄连丸中黄连与生地的最佳配伍比例及该配伍的化学物质基础。2.找出黄连丸方剂配伍—物质基础—药理效应三者之间的关系,阐明黄连丸方剂配伍的科学内涵。方法
目的观察超声K型锉与手用K锉型进行根管治疗的临床效果。方法使用规定器械和材料,专人操作,制定统一评价标准。结果通过手用根管器械与超声根管器械进行根管治疗的临床效果对
近年来,我国经济高速发展,城镇化进程也逐渐加快,促进了我国社会的发展进步,但同时也带来了一系列的资源环境问题,进而又限制了工业化和城镇化的持续发展进程,严重的还可能导