【摘 要】
:
在数据大爆炸的时代,如何有效地分析和管理这些数据信息变得尤为重要,而聚类分析是人们对数据进行分类的重要技术。它不仅可以作为一个独立的工具使用,进行数据的预处理、分
论文部分内容阅读
在数据大爆炸的时代,如何有效地分析和管理这些数据信息变得尤为重要,而聚类分析是人们对数据进行分类的重要技术。它不仅可以作为一个独立的工具使用,进行数据的预处理、分析数据的分布、了解各种数据的特征,还可以作为其他数据挖掘功能的辅助手段。因其具备重要的应用价值,一直成为这一研究领域的热点。基于划分的蚁群聚类算法是基于蚂蚁觅食原理的智能聚类算法,虽然它是一种自组织的、正反馈的、本质上并行的、健壮的优化算法,但仍然存在陷入局部最优的缺点;基于密度的CFSFDP(Clustering by Fast Search and Find of Density Peaks)算法,算法思想简单易实现、聚类效果优,但是对多个密度峰值聚类中心的选取易出现错选。针对上述两类算法的不足,本文主要提出了两个改进方案。针对蚁群聚类算法存在易陷入局部优化的缺点,提出了一种基于随机搜索变异策略的蚁群聚类算法,主要是通过随机选择的方式进行变异操作,改进算法的搜索能力。选取UCI数据集进行数值模拟实验,结果表明:所提出的改进算法在目标函数值F、兰德系数、调整兰德系数和标准互信息划分等方面均优于基本蚁群聚类算法、k-means算法。最终验证了改进算法对数值优化问题较好的寻优能力。针对CFSFDP算法在单个簇中存在多个密度峰值时,难以通过决策图确定聚类中心数量,导致聚类效果不佳的情况,提出将所有密度大于当前位置的数据点及其与当前位置存在最小距离的数据点各归为一个集合,并对高斯核求得的局部密度排序。这样,当存在多个密度峰值时,只选择第一个点作为聚类中心,同时利用归一化的γ值分布图确定聚类中心数。人工数据集和UCI数据集的数值模拟实验表明,改进CFSFDP算法在调整兰德系数、同质性、完整性、V-measure和标准互信息评分等各指标值均优于CFSFDP算法、DBSCAN算法和k-means算法。该改进算法弥补了 CFSFDP算法对多密度峰值不能很好聚类的缺陷,适用于对较低维度的任意型数据集聚类。最后,将改进的两类算法分别应用于实际问题中。利用改进蚁群聚类算法对2015、2016年世界上发生的未知恐怖组织或个人的所有恐怖袭击事件数据样本进行特征分析聚类,大致推断出新生的恐怖组织或个人的数量,为后续实现事件制造者的身份“认定”提供依据。利用网络爬虫技术采集了加拿大地区1976-2004年21个气象站点的相关数据,在对所有数据预处理的基础上,利用改进CFSFDP算法聚类分析模型将所有21个站点分为6类,以5年为一个年代际,对加拿大地区温度的时空变化趋势展开分析。这些实际应用说明两类改进的算法有一定的实用价值。
其他文献
利科主张翻译即阐释,阐释的目的是促进理解的实现。但是在阐释的过程中经常发生源于语言、文化、习俗、历史、传统和宗教方面的冲突。利科认为解决冲突的关键在于“范式”的应用。范式的构建是利科翻译研究的重要组成部分,也是理解其翻译理论的核心。为此,本文将梳理利科翻译范式构建的基础和内容,以理解其翻译理论。本文主体分为三章,第一章梳理和说明利科范式建立的基础。“范式”一词最早出现在亚里士多德的《修辞学》中,目
本文以民航企业信息系统建设作为研究背景,讨论和研究的是项目的需求分析及范围变更管理,是项目范围管理的核心部分。其中,在需求分析方面将讨论需求收集阶段、明确项目范围及周边接口阶段的流程与方法。针对每个部分文章中都从一个企业内部信息部门项目管理者的视角分析了在传统工作模式下存在的问题和困惑,然后提出解决方案。在需求收集阶段,本文分析出在传统工作模式下存在的问题和困惑如下:(1)信息部项目人员同业务单位
现代化工业过程控制系统一般拥有成百数千个控制回路,具有大规模、高集成、强耦合等特点。为了最大限度地提高生产效率并确保产品质量,通常要求控制回路在最佳状态下运行。但
微流控是一种精确操控微尺度流体的技术,利用光操纵微液滴运动及诱导微液滴内粒子的输运是微流控系统驱动的一种新模式,具有非接触操控、波长和功率易调节、时空分辨率高等优
提高航空发动机/燃气轮机涡轮进口的燃气温度是提高燃气轮机效率的关键手段。随着涡轮进口燃气温度的不断提高,人们迫切需要新型高效的涡轮叶片冷却技术。本文主要通过实验和数值仿真计算研究三种叶片内部对流冷却结构的传热性能与流阻特性。本文的实验主要有两块:稳态实验和瞬态实验,仿真主要采用稳态的计算方法,实验和计算相配合,以比较分析其各自的努塞尔数和摩擦因子,以期寻找到性能更优的对流换热结构,并且得出它们增强
本文重点是研究通过飞秒光学频率梳,产生超低噪声的微波源。随着科技的发展,高精度的微波信号在基础研究、工业、国防、医学的各式各样的领域都起到了重要的推进作用。传统的
目的:探索岩白菜素对间充质干细胞成骨分化的影响方法:取人间充质干细胞,分为培养液中加入岩白菜素组和不加入岩白菜素组。均进行成骨诱导分化和成脂诱导分化。用染色及检测成骨和成脂特异性标志物的方法来判断岩白菜素在体内对间充质干细胞的成骨分化及成脂分化的影响。取健康雄性SD大鼠12只。将大鼠随机分成两组:实验组(n=6)和对照组(假手术组n=6)。使用环钻在顶骨中产生4mm的临界尺寸缺陷。实验组用50mg
本文以龙虬庄遗址的文化遗存和自然遗物为主要研究对象,运用地层学、类型学的相关理论知识,对所涉及到的遗址的物质遗存重新进行系统的分析、整理。引入央地关系模型,分析龙
当前社会信息化、自动化、智能化快速发展,信息的安全性越来越重要。随着国家电网电力公司“三型两网、世界一流”战略目标的提出,打造枢纽型、平台型和共享型企业,建设运营
从国家政策的导向、社会发展的要求以及幼儿身心发展的特点来看,在幼儿园教育中,加强幼儿的社会性教育具有重要的社会人文价值。音乐活动作为幼儿园教育中艺术领域的重要组成部分,在轻松愉快的氛围中,律动、歌唱、器乐等学习中蕴含了众多社会学习的契机,是促进幼儿社会性发展的重要手段。主题背景下音乐活动,融合了其他领域的经验,在教育内容、教育方法以及教育过程中具有整合性的特点,更有利于幼儿社会性的发展。本文的研究