基于真实核心点的密度聚类方法

来源 :计算机应用研究 | 被引量 : 4次 | 上传用户:z245713805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前聚类算法不能有效地处理模糊边界点的问题,提出了一种基于真实核心点的RDBSCAN聚类算法。提出真实核心点的概念,首先在密度聚类过程中的核心点进一步处理分类,把影响聚类效果的伪核心点剔除,将剩下的真实核心点根据密度可达原则进行聚类;然后提出密度合并判定定理:相同类簇内点的真实密度远大于不同类簇的点,以此为指导判断真实核心点的真实密度,使类簇内各点的相似性更大。通过人工数据集与UCI数据集聚类实验可看出,RDBSCAN算法降低了模糊边界点的干扰,而且出现了若干新颖的类簇分类,在密度不规则的数据集
其他文献
为降低颜色串扰对提取结构光图像特征的影响,通常将多像素条纹细化为单像素线条,降低了重建图像空间分辨率。针对这一问题,设计一个基于面结构光几何关系的三维数字化系统,并提出一种以面结构光投影仪像素为单位的特征提取与匹配新方法。首先,投影仪向被测物体投射设计好的面结构光,为被测物体增加有效特征,双目摄像机捕获被测物体两张图像,设置阈值滤除图像背景、去除噪声,提高图像质量;然后,基于单位投影像素提取特征点
针对现有的并行模糊测试在测试效率、资源利用率以及异常处理上的局限性,围绕测试资源的生成、使用及容错三个方面提出了一种动态资源感知的系统化解决方案。针对测试环境在大规模和多场景两个维度快速搭建的需求,提出一种基于云平台的动态构建方法,加快测试环境部署,提高有效fuzz时间;针对并行模糊测试中资源利用率低的问题,提出一种多层次并行度动态调整的资源配置策略,优化整体测试资源配置并提高单机负载;针对大规模
通过对商品评论进行基于方面的情感分析,可以得到某件商品各个方面的优劣情况。提出利用三层CRF模型进行情感极性分类及强度分析。在CRF模型中,融合了词、词性、语气词、程度词、方面和评价词的共现等特征。在情感句识别、情感极性分类和情感强度分析上得到的F1值分别为86.3%、77.2%、70.7%,证明了:a)分层CRF模型在各个层次的任务中都能取得较好的结果;b)语气词、程度词、方面和评价词的共现特征