基于加权K近邻的改进密度峰值聚类算法

来源 :计算机应用研究 | 被引量 : 10次 | 上传用户:whxust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密度峰值聚类算法是一种新颖的密度聚类算法,但是原算法仅仅考虑了数据的全局结构,在对分布不均匀的数据集进行聚类时效果不理想,并且原算法仅仅依据决策图上各点的分布情况来选取聚类中心,缺乏可靠的选取标准。针对上述问题,提出了一种基于加权K近邻的改进密度峰值聚类算法,将最近邻算法的思想引入密度峰值聚类算法,重新定义并计算了各数据点的局部密度,并通过权值斜率变化趋势来判别聚类中心临界点。通过在人工数据集上与UCI真实数据集上的实验,将该改进算法与原密度峰值聚类、K-means及DBSCAN算法进行了对比,证明
其他文献
12月12日上午,市政府网站上发布沈阳市人民代表大会常务委员会办公厅第18号公告,面向社会广泛征求对《沈阳市多规合一管理条例(草案)》的意见。$$公告发布不久,沈阳铁西美莱医疗
报纸
2014年新一轮的高考改革拉开序幕,作为试点地区的浙江、上海,为应对高中教育多样化发展的诉求开始逐步形成了以综合评价、分类考试、多元选拔为特征的新高考。新高考改革以选
本文引入并研究了连续广义度量空间.本文首先证明了对于连续的广义度量空间,c-Scott拓扑和广义Scott拓扑相等,然后证明了连续度量空间之间的非扩张映射Yoneda连续当且仅当它
设D为复平面C上的单位圆盘,σ是定义在D上的解析自映射.本文给出了当σ(z)=az+c且非恒等映射时Bergman空间上的复合算子Cσ复对称的充要条件,进而得到了Bergman空间上是复对
为了能够实现对水体下急倾斜煤层回采作业的安全进行,本文主要以某煤矿的急倾斜煤层作为主要研究对象,对急倾斜煤层开采过程中的防水煤柱稳定性相关的影响因素进行了分析。通
为了防止特征的共适应性,提出利用余弦相似度来减少潜在特征之间的相关性,从而提高非负矩阵分解(non-negative matrix decomposition,NMF)的独立特征学习能力。此外,为了使得分解后的矩阵具有较好的稀疏性,提出在传统NMF模型中引入L_(2,1/2)稀疏约束,增强了算法的局部学习能力和稳健性。因此,潜在特征中的语义信息更加明显,潜在空间的表示更具有判别性。在fetch_2
为了解决传统抽象式摘要模型生成的中文摘要难以保存原文本语义信息的问题,提出了一种融合语言特征的抽象式中文摘要模型。模型中添加了拼接层,将词性、命名实体、词汇位置、TF-IDF等特征拼接到词向量上,使输入模型的词向量包含更多的维度的语义信息来确定关键实体。结合指针机制有选择地复制原文中的关键词到摘要中,从而提高生成的摘要的语义相关性。使用LCSTS新闻数据集进行实验,取得了高于基线模型的ROUGE得
为提高专利文本自动分类的效率和准确度,提出一种基于双通道特征融合的WPOS-GRU(word2vec and part of speech gated recurrent unit)专利文本自动分类方法。首先获取专利摘要文本,并进行清洗和预处理;然后对专利文本进行词向量表示和词性标注,并将专利文本分别映射为word2vec词向量序列和POS词性序列;最后使用两种特征通道训练WPOS-GRU模型,并