【摘 要】
:
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使用相互可达距离(mutual reachability distance)代替传统算法中的欧氏距离,表示数据集中对象与对象之间的距离,解决因密度分布不均匀导致效果不佳的问题;为了建立对象与对
【机 构】
:
南京邮电大学 通信与信息工程学院,江苏 南京 210003
论文部分内容阅读
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使用相互可达距离(mutual reachability distance)代替传统算法中的欧氏距离,表示数据集中对象与对象之间的距离,解决因密度分布不均匀导致效果不佳的问题;为了建立对象与对象之间的联系,同时保留对象之间的距离特性,引用Prim算法对数据集中的所有对象构建最小生成树;其次根据指定的簇的数目及最小簇对象数数目参数对得到的最小生成树进行剪枝;根据剪枝的结果,将剪枝后的各个部分进行聚类.在公开的UCI数据集上的实验结果表明,提出的MST-DBSCAN算法与现有DBSCAN、OPTICS、KANN-DBSCAN算法相比,在密度分布不均匀的数据集上聚类效果有所提升并且较原有传统算法有较高的聚类准确性.
其他文献
本文针对《丝网印刷技术》中的教学改革进行了总结归纳.从理论与实践的角度分析了职业教育“三教改革”的重要性.本文结合《丝网印刷技术》课程教学过程阐述了“三教改革”在授课过程中的实际运用,对高职印刷类专业的实践操作课程具有重要的参考价值.
通过肺部CT影像进行肺结节检测是肺癌早期筛查的重要手段,而候选结节的假阳性筛查是结节检测的关键部分.传统的结节检测方法严重依赖先验知识,流程繁琐,性能并不理想.在深度学习中,卷积神经网络可以在通用的学习过程中提取图像的特征.该文以密集神经网络为基础设计了一个三维结节假阳性筛查模型—三维卷积神经网络模型(TDN-CNN).首先利用U-Net提取CT图像的肺实质再截取以结节为中心的VOI,通过平移和翻转扩充正样本数据;在3维假阳性筛查网络中,通过稠密连接强化特征利用、扩大特征空间,采用瓶颈层降低参数冗余,训练
铁路工程地质勘察资料数量非常庞大,单条线路的工程地质资料超过1 TB,其中大部分是文档、图像等非结构化数据,这些资料反映了岩土工程特点和地质条件,是工程设计阶段最重要的依据.在项目工期紧和质量要求高的大背景下,传统的资料查阅方式给工程设计人员造成相当大的困扰,急需设计实现一套快速、扩展性强、支持众多文件格式的资料检索系统,以提高资料检索的速度、准确度,同时贴合设计人员使用习惯,以更丰富的检索体验来提高设计工作效率.该文分析了铁路工程地质勘察资料检索的特点,解决了系统设计的架构和处理流程,涵盖了海量、非结构
模拟课堂教学行为的教学优化算法,具有操作简单且搜索能力强的突出优点.尽管该算法为增强种群多样性采取了消除重复个体操作,然而在算法后期依然容易陷入早熟收敛.为提高教学优化算法的搜索能力,该文通过融合涡流搜索和差分进化这两种策略,提出了改进措施.改进后的算法包括:教师自学、向教师学、学生互学三种行为.首先,在每轮循环的开始,增加了基于涡流搜索的教师自学习行为,从而使作为最优个体的教师也获得一定的改进机会.其次,在教师阶段和学生阶段的个体更新式中,均增加了体现不同个体之间差异的差分算子,同时在学生阶段增加了轮盘
2022年国际文化创意中心·中部(长沙)印刷产业博览会将于2022年4月20~22日在芒果馆·湖南国际会展中心举办,再次扩容提质,集合展销印刷包装设备耗材、数码广告设备、广告标识,集中展示印刷行业发展的新理念、新技术、新材料、新设备、新工艺、新产品、新模式以及文化创意产业与印刷产业融合的新亮点、新机遇、新发展,推动长沙印刷业高质量发展.
由于传统的驾驶员违规接听电话行为检测方法缺乏一套严谨的评判模型,难以满足现实中驾驶员违规接听电话的识别需要,因此如何建立一套合理有效的评判模型成为亟待解决的问题.针对目前评判模型的局限性,采用计算机视觉技术和深度学习模型相结合的方式对驾驶员违规接听电话行为进行科学评判.主要是通过提取的Haar-Like特征训练级联分类器捕获脸部特征,采用CNN模型和ROI技术提取手部特征,并利用YoloV3目标检测算法识别手机,依据特征间的空间位置关系来判断驾驶员是否存在违章接听电话行为.通过大量数据的实验测试,结果证明
镭雕(laser又名激光雕刻、激光打标、镭射打标),镭雕是表面处理的一种工艺,和网印、移印相似,都是在产品上印字或者图案之类,工艺不同,价格有异.但相比之下镭雕有标记速度快,图像标记美观,分辨率高,永不磨损,范围广泛,安全可靠,精确性高,效果一致,高速快捷,成本低廉,防伪性强等优点.
公司简介rn佛山世科兴远智能装备有限公司(佛山市世科玻璃技术有限公司)成立于2007年,是一家专业研究开发玻璃深加工技术、新工艺及其配套设备制造的综合性高新技术企业.历经数位工程技术人员的多年探索与实践,已成功开发研制出水平辊道式平/弯钢化玻璃生产线、强制对流加热钢化玻璃生产线、全自动智能型连续热弯玻璃生产线等,并已广泛应用于国内外建筑装饰、车辆交通、民用家具、家电、工业仪表等各个领域.
为了解决油田企业在信息化建设和信息资源管理过程中存在的数据“看不到”、“读不懂”、数据标准不统一、信息孤岛导致数据共享不充分等问题,以实现企业数据资源统一组织管理与开放共享,基于国内外信息资源规划和数据管理成熟理论,设计提出了“业务-系统-数据关联法”摸底梳理企业业务、数据资源和系统现状及需求.从业务入手,梳理企业业务架构以构建油田业务模型,并基于企业标准数据模型结合业务系统数据模型、用户视图与业务需求等分析梳理企业数据资源,设计统一的数据元标准和规范化的企业级数据模型描述数据资源.最后基于数据模型以业务
丝网印刷T恤衫的工艺参数随着印量与图案类型的变化而变化.本文针对印量为100件以上的网目调图案类T恤衫印刷的网版目数、绷网张力、曝光时间、版模厚度以及图像的加网线数进行了数据研究,通过结果比对出适合网目调丝网印刷的T恤衫的工艺参数,对丝网印刷T恤衫的图像精度提升具有重要指导意义.