基于两阶段的聚类边界检测算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zzyb123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展与创新,信息技术及计算机技术给社会带来极大的进步,数据库的信息量也随着增长,形成了大量多元化数据,并蕴含丰富的信息。数据挖掘便是一种能够快速有效的帮助我们从这些大量的多元数据中提取出有效信息的技术。聚类分析是数据挖掘的重要组成部分之一,在任何分析含有多元数据的领域中都很普遍。而聚类边界检测在图像处理、机器学习和实际应用中具有重要的作用,但对聚类边界检测研究还处于起步阶段。准确地检测聚类边界有助于提高聚类或分类的精度,也能对边界数据的特征进行深入研究。本文在分析现有聚类边界检测算法的基础上,先求得候选边界集,然后再确定聚类的精确边界,基于这种逐步求精的思想,提出了两种新的聚类边界检测算法:基于双阈值分割的聚类边界检测算法(BDDTS)和基于改进的harris算子的边界检测方法(BDHO)。BDDTS边界检测算法根据数据点的准则函数值的不同,利用高低两个阈值将数据对象分为聚类的内部点、中间点和外部点三个点集,然后从中间点集中去除内部点,并与外部点集合并,形成了候选边界集。再对候选边界集进行二次处理,得到比较精确的边界。实验结果表明,该算法可以快速有效的检测任意形状、任意大小和不同密度的聚类边界点,在真实数据和高维数据集上同样适用。同时,算法参数也易于选取。BDHO边界检测算法以图像处理中的harris算子为基础。先选取一个参考方向,然后通过角度信息选取另一个方向,计算这两个方向上数据点的方向变化率,根据改进的harris算子的思想,计算这个对象的边界点响应函数值,并利用边界响应阈值去除大部分内部点和噪声点,所留下的数据点为边界点和部分靠近边界的点或者稀疏的部分内部点。再利用角度响应阈值完善这个边界。算法能够处理多密度、不同形状、任意大小的数据集。本文提出的这两个边界检测算法引入了其他领域的知识,能够有效的解决聚类分析中边界检测问题。
其他文献
随着网络的广泛应用,网络安全问题也越来越严峻。当前网络攻击方法层出不穷,入侵规模不断扩大,使得目前防火墙等被动的网络安全机制对许多攻击无能为力。入侵检测技术作为一
随着经济的增长,城市化进程的加快,城市内的人口越来越多,而个人拥有车辆的比率在逐年增加,极大的增加了公路的压力。为了缓解压力,需要修建公路,然而由于城市的规划及地理原因很多
随着Web服务技术的迅速发展,越来越多的Web服务运行在Internet上,这些单一的Web服务功能有限,不能满足用户的需求,但是这些单个、基本的Web服务,允许其他应用程序通过互联网
Web服务(Web Service,WS)技术是独立于平台和编程语言的、具有自包含和松耦合的以互联网为基础的新型的分布式计算模型。由于其自身的开放性,Web服务的安全性问题日益严峻,成
随着电力系统规模越来越大,大量的非线性设备引起的谐波在造成电能质量污染的同时,也影响了电力系统安全运行。电力部门和电力用户对电能质量的关心程度与日俱增。   本文
随着中国市场经济的高速发展,以个人的信用作为担保向银行贷款正在成为一种趋势。信用贷款数量以及贷款金额的不断增加,使得银行面临客户违约所造成的风险也在逐年增加,因此,
随着中央一号文件提出“‘互联网+’农业”的行动计划,我国农资电商行业悄然兴起,打破了传统农资市场“面对面”的营销模式,实现了农资产品的跨空间实时交易。我国农资产品品种多、规格不一,农资市场分散性、季节性、地域性强,同时受自然条件影响,农作物生产成块状交替分布,不同地区、不同季节用户种植的农作物种类差异大,用户个性化需求特征明显,但是当前农资电商系统在扩大农资产品经营范围的同时逐渐使用户陷入信息冗余
伴随网络通信业务的不断快速发展,分布式和智能化将成为电信网管的主流和趋势,特别是对网络中各种设备不同性能参数的监控,能够实时地展现出整体的网络情况,所以性能高效、可用性
叶片是植物、作物最重要的器官之一,在呼吸、光合、蒸腾以及养分转化等方面有着不可替代的作用。通过检测叶片的含水率,可以掌握作物的生长状态,为灌溉、施肥等生产管理提供
在2G时代,由于网络速度比较慢,特别是无线网络,稳定性比较差,对于一些欠发达地区来说更是如此,然而恰恰正是这些地区相对缺乏网络维护的技术人员,远程控制技术的出现可以很好