面向高维特征缺失数据的K最近邻插补子空间聚类算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:wangkaidi58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高维特征缺失数据在聚类过程中面临的数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法。首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的缺失数据进行KNN插补;然后,多次迭代矩阵分解和KNN插补获得数据的最终可靠的子空间结构;最后,利用获得的子空间结构进行聚类分析。通过在6个高维数据集上对不同算法进行比较测试来验证所提算法的有效性。其中,在Scene缺失数据集上,与期望值最大化(EM)插补结合子空
其他文献
第四纪冰期的千年尺度气候突变事件——Dansgaard-Oeschger Event (D-O)事件,一直是古气候学领域关注的重点。近年来,数值模拟的研究发现,北大西洋副极地地区年际-年代际气候变率的振幅在D-O事件中的冰阶冷期远大于间冰阶暖期,这一现象为理解该区域海温代理指标的气候学意义提供了重要参考价值,但其动力机制尚不清晰。本文利用海气耦合气候模型(COSMOS),通过模拟氧同位素(MIS)
期刊
气候重建工作的深入开展极大地促进了全新世亚洲季风变化的研究,然而当前重建结果对亚洲季风的演变特征和机理存在很大争议,开展古气候模拟对理解全新世亚洲季风演变的时空特征和成因机制具有重要意义。为此,本文主要从气候模式模拟的角度去回顾全新世亚洲季风百年-千年尺度变化的模拟研究工作,并将从外强迫和气候系统内部变率这两个角度对机制进行探讨。主要有以下进展:全新世瞬变模拟试验结果反映出早全新世以来亚洲季风降水
期刊
国际海道测量组织(International Hydrographic Organization,IHO)发布的S-52显示规范定义了航行环境下电子海图的具体显示参数,但是其解析渲染需要特定软件,无法适应当前GIS软件对电子海图生产的需求。开放式地理信息系统协会(Open GIS Consortium,OGC)图层样式描述规范(styled layer descriptor,SLD)是一种开放的符
期刊
利用国际古气候模拟比较计划(PMIP)最新第4阶段(PMIP4)中14个气候模式的试验数据,集中研究了距今约6000年的全新世中期中国气候和东亚季风。与早期PMIP第三阶段(PMIP3)多模式结果类似,全新世中期中国年、冬季和春季地表气温较工业革命前期偏冷,而夏季和秋季偏暖,其中年和冬季模拟偏冷与大部分地质记录显示的偏暖不符;所有14个PMIP4模式集合的中国区域平均年和季节温度变化值为0.08~
期刊
我国的地热发电以及部分供暖工程出现了比较严重的结垢现象,阻碍了地热能的大规模开发利用,目前地热市场急需成熟的防垢理论和工艺。地热工程的结垢现象尤以碳酸钙结垢最为普遍,为解决碳酸钙结垢问题,本文以华北保定岩溶地热井结垢为研究对象,通过理论和实验相结合的手段研究分析了垢质成分,成垢机理,结垢位置和过程以及防垢措施。研究结果表明:(1)系统降压造成的闪蒸是碳酸钙结垢的主因,液相二氧化碳逸出到气相是碳酸钙
期刊
热液矿床深部控岩控矿构造展布格局与深部矿床(体)空间定位格局等关键问题一直是制约深部勘查部署和实现找矿突破的焦点和难点。在阐述岩浆热液成矿系统矿田(床)控岩控矿构造深延格局主要研究方法的基础上,按照岩浆热液成矿系统成矿构造体系控制多金属成矿系统、物化探异常信息系统映射多金属成矿系统的研究思路,以湘南地区坪宝铜锡多金属矿田为例,构建了矿田成矿构造体系和控岩控矿构造深延格局、控矿构造深延综合指标评价体
期刊
现存的成本函数没有考虑到业务流程中各活动在现实情境中有着不同的重要程度,于是在模型与日志的对齐过程中可能会导致对齐成本严重偏离感知成本。针对这一问题,基于业务流程中行为的典型流特征提出了重要同步成本函数的概念,并在该函数下给出一种能够提升效率的对齐方法。首先,基于感知成本的概念定义重要同步成本函数;接着,依据日志迹和流程模型中行为的典型流特征确定用以分割流程模型与日志迹的重要匹配子序列;最后,基于
期刊
针对已有的道路建模技术中建模效果不理想, 在大尺度道路网建模中缺乏有效的辅助交互技术支持的问题, 通过对立交结构进行分析, 提出一种有效的三维立交结构的欧拉图表达及交互设计方法. 首先将道路信息预处理, 根据处理后的有效数据构建欧拉图, 用来表达道路立交结构的拓扑关系; 然后利用欧拉图和道路的结构特性计算得到道路的层级关系; 再根据控制点、欧拉图的拓扑信息和道路网格, 构建立交结构的三维模型; 最
期刊
岩体质量分级是进行工程设计和施工的基础。通过搜集不同地区55组实测样本和17组插值样本建立案例库,考虑岩体的复杂不确定性以及异地岩体的差异性,在案例库基础上提出一种改进两阶段回归迁移学习(Two-stage TrAdaBoost.R2)-孤立森林(Isolated Forest)多因素岩体质量等级预测模型。将广州抽水蓄能电站第1期地下工程的12个样本用于模型测试,研究结果表明:(1)迁移学习可以通
期刊
针对由于驾驶员对于道路限速和时延信息获取的不确定性而引起的跟驰行为受扰和交通流失稳等问题,提出了一种车联网环境下考虑时延速度差和限速信息的跟驰模型(TD-VDVL)。首先,引入时延导致的速度变化量和道路限速信息对FVD(Full Velocity Difference)模型进行改进;然后利用线性谱波微扰法推导出TD-VDVL模型的交通流稳定性判断依据,分别分析模型中各参数对系统稳定性的影响;最后利
期刊