基于迁移学习的软子空间聚类算法

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:fuyuanluyi13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,大量的高维数据在生活中无处不在.聚类是分析描述数据并按照某种相似性将数据归类的一项技术.传统聚类算法在面对高维数据时,往往无法进行有效的聚类处理.软子空间聚类是通过分配权重,描述样本隶属于不同簇的不确定性来进行聚类,然而,当数据残缺或信息不准时,现有的软子空间聚类的准确度和效率会受到很大的影响.从软子空间聚类面临的问题出发,提出一种改进的软子空间聚类算法;同时针对数据残缺不足的问题,引入迁移学习来削弱数据量不足对聚类分析的影响;通过引入信息熵的概念,用信息熵确定高维数据权重.实验证明
其他文献
多年来在铁路设计中对克服平面曲线阻力和隧道阻力均采用"坡度折减"法(即当量坡法),而实际大型机车牵引力(牵引质量)与设计牵引质量相差很多,无形中造成牵引力的极大浪费(留出一定富
互联网金融是传统金融与互联网公司利用互联网技术实现在移动设备端进行投资理财,支付消费,资金融通、信息中介等金融功能的新型金融业务模式。本文从互联网金融消费投资者心
“被xx”是近几年社会经济迅速发展形势下借助网络而一夜走红的流行语。本文以三个平面的语法理论为理论基础,从语义、语用两个角度分析其较传统被字句的新发展:语义上,“被xx”
黄酮类化合物(flavonoid)是广泛分布于多种植物叶、皮、根和果实的一类低分子天然成分,是以C6-C3-C6为母核的多酚类化合物(polyphenoliccompounds)。因为结构中含有稳定的酮基
新农村的建设是一项复杂的系统工程。需要各个方面的共同努力。其中政府作为新农村建设中的主要主体,占据着主导地位,必须充分发挥其自身的职责和作用,否则将会严重阻碍社会主义
规则提取是知识发现的一个重要研究方向.多源数据是一类重要的数据集,从不同的角度对多源数据进行规则提取可为决策行为提供更加可信的依据.以多源决策表为数据基础,首先以数
2001.1~2004.4月我们对12例低位直肠癌Miles术后乙状结肠造口早期出现不同程度的造口缺血、局部坏死的病人,通过密切观察造口的血运情况,去除增加造口缺血的诱因,心理护理,给予频普
通过分析提高自主创新能力对于湖北转变经济增长方式、优化产业结构和构建促进中部崛起的重要战略支点的意义.阐述了提高自主创新能力对于促进湖北经济发展的重要作用,提出了提
基因转录是细胞最重要的活动之一,涉及众多分子事件,且不同基因间存在显著差异性.建立基因转录的模型有助于理解复杂的转录动力学和调控机制.如何构建合适的转录模型依然具有
王昭君是中国古代四大美女之一。能选入四大美女,不仅仅是因为她的美貌被推上政治舞台;不仅仅是帝王的工具而名垂千史;更不会仅仅是因时势而成。然而从唯物辩证法的观点不难看出