一种融合三支决策理论的改进K-means算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:yyyyoooouuuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的K-means算法及其改进算法在对数据集进行聚类划分时通常精确地确定样本点与聚簇的隶属关系,没有充分考虑隶属关系模糊的边界点.本文提出一种结合三支决策理论的改进算法TK-means.首先,将数据空间分为核心区域和边缘区域分别处理,解决K-means算法对所有样本点统一处理造成的聚类结果不准确的问题;其次,结合网格聚类算法中划分网格的思想快速确定核心点和边缘点;最后,设计了新的初始聚类中心确定方法,可有效解决K-means算法初始聚类中心随机选择使得聚类结果不稳定的问题.通过模拟数据集和UCI数据集的大量实验证明,TK-means算法比现有经典的K-means及其改进算法拥有更好的性能.
其他文献
针对产品信息交换中设计意图语义挖掘需求,以STEP AP242为基础,构建产品三维几何信息与非几何信息语义关联的STEP知识图谱,实现STEP设计意图提取和交换.重点研究了STEP知识图
人脸表情识别任务在近些年取得了广泛的研究和应用,但是由于装饰物以及人的行为等其他因素,会对人脸的局部区域产生遮挡或破损,从而降低了表情识别的精度.针对有局部破损或遮挡的低质人脸图像表情识别,本文提出了一种基于端到端的低质人脸图像表情识别方法.本文通过在现有的人脸数据集上人为添加破损或遮挡作为低质样本集,利用生成对抗网络修补破损的区域,将复原后的图像和低质的图像以及原始不存在局部遮挡或破损图像通过分
在通过生物特征对人脸认证识别时,针对支持向量数据描述存在不能紧密包裹、没有合适拒识机制、正确识别率不能逼近100%的问题,提出了一种具有合适拒识机制的高正确识别率分类器设计算法—基于同类特征点集和包裹点集的同类特征区域紧密包裹曲面的求解算法,设置所有紧密包裹面之外的公共区域为分类器的拒识区域,用ORL人脸库和扩展Yale B人脸库各自作对比实验表明,本文的方法在较小拒识率情况下,分类器正确识别率能
近年来,机器学习算法广泛应用于多个领域.超参数的选择直接影响了算法模型的性能,然而超参数优化过程往往依赖于专业知识和长期经验的积累.为了解决上述问题,本文提出了一种
多标记特征选择是机器学习和人工智能领域的研究热点之一,现有多标记学习的研究是假设每个示例的标记呈均匀分布,即每个示例的各个相关标记的重要程度相同.然而,在许多应用领
QR码(Quick Response Code)作为重要的信息载体,正面临着严重的信息泄露和信息篡改等安全威胁.本文提出一种基于拟态防御思想的QR码信息加密架构(Mimic QR Code,M-QR),以提升
针对SRGAN红外图像超分辨重建时,存在图像高频特征丢失及细节伪影问题,本文提出双判别生成对抗网络DDSRGAN(Double Discrimination-SRGAN)重建算法,并改进网络结构.在图像判别器的基础上增设特征判别器,在生成网络中引入无BN(Batch Normalization)层的残差中的残差块RIRB(Residual in Residual Block),内部残差块密集连接,
为了解决K-means算法对初始聚类数k和初始聚类中心经验参数的依赖问题,提出了一种基于最小生成树的无参数化聚类MNC算法(MST based Non-parameterized Clustering).首先将待
有容量集合覆盖选址问题是组合优化中的一个经典的NP-Hard问题,在许多工程领域和科学领域中的应用十分广泛.本文将集合覆盖问题的模型应用到有容量设施选址问题中,首先研究了
为了缩小可见光视频和红外视频之间的模态差异而提高红外行为识别率,以及简化深度学习用于红外行为识别需人工标注数据集繁琐的问题.基于迁移学习的思想,本文提出一种用可见光动作(源域)来识别红外动作(目标域)的无监督异构红外行为识别算法(UHDIAR). UHDIAR算法将可见光数据和红外数据映射到同一个对齐的特征空间中,采取余弦相似度调整源域样本的权重,利用对齐后的可见光数据训练权重支持向量机(W-SV