基于偏最小二乘法的高维数据粒降维及聚类研究

来源 :第十二届中国Rough集与软计算学术会议、第六届中国Web智能学术研讨会及第六届中国粒计算学术研讨会联合学术会议 | 被引量 : 0次 | 上传用户:mishier
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在尽可能保留有用信息的前提下,实现高维数据的降维;有效实现粒度粗细之间的转换,获取不同层次的信息是非常有意义的研究.首先,利用偏最小二乘法,按相关性最大来提取最强解释能力的信息,实现高维数据的降维.其次,通过主成分信息聚类,获取不同层次的信息粒.最后,根据需求选择合适的粒度进行分析.实验表明,文中所提方法是可行有效的.
其他文献
带通配符约束的模式匹配是热点的研究问题.在一个给定的文本和带灵活通配符的模式中,计算模式在文本中的出现次数是个非常困难的问题.提出了一个时间复杂度和空间复杂度分别为O(n+m+a)和O(m+B)的算法TAIL (paTtern mAtching with wiLdcards),其中n和m分别表示文本和模式的长度,a是所有子模式在文本中出现的数目,B是模式中通配符间距下限的总和.解决此问题,先前最好
移动机器人在未知环境中移动时,往往由于环境的杂乱无序而无法实时导航和避障,因此无法到达目标点.为此,在文中提出了一种基于反应式的避障控制方法,在方法中使用“分而治之”的策略,将复杂的环境设计成不同的情景,并通过设计的情景-动作规则来确定机器人所处的情景,然后根据不同的情景选择合适的动作;使用该方法控制移动机器人能够在未知的环境中实时地检测出障碍物,并实时规划出合理有效地路径,稳定、平滑不间断地向目
多Agent系统中,Agent间通过形成联盟达到提高任务求解能力、获取更多收益的目的.主要关注联盟模型的改进和联盟形成阶段的改进.基于ARG元模型提出了一种采用角色和学习机制的新联盟模型:CLAR联盟模型.接着在采用合同网协议的CLAR联盟模型中提出两阶段联盟形成机制,并通过捕食者问题验证了角色和学习机制的作用以及两阶段联盟形成机制在减少通讯代价上的作用.
Infrared image denoising is the basis of infrared application system.The existing denoising methods only consider independent pixel in infrared image,without considering the relationship among pixels.
选择性单商品配送收集问题(1-TSP-SELPD)是单商品配送收集问题(1-PDTSP)的推广,在许多实际领域都有广泛应用.1-TSP-SELPD属于NP难问题,为了有效解决该问题,文中设计了一个改进的最大最小蚂蚁系统算法.该算法从3个方面进行了改进:第一是启发式参数随着搜索状态自适应调整;第二是信息更新量随着求解质量进行动态变化;第三是设计适用于1-TSP-SELPD特点的、有约束的局部搜索技术
提出一种基于目标因子间依赖关系的启发式搜索方法,给出目标因子间依赖关系的形式化定义,并讨论其对搜索过程的重要性.随后介绍目标因子间基于有利动作的有利值理论以及依赖关系树技术.最后给出一种计算依赖关系树和有利值的算法.其所有思想均在Fast-Downward规划器上实现.通过在2008国际规划大赛标准问题领域的实验结果表明,该方法能有效提高规划解的最优度.
现阶段关于方剂配伍规律的研究主要采用数据挖掘技术,包括分别以分类和聚类为主的研究模式和以关联规则挖掘为主的研究模式,这两种研究模式作为研究中药方剂的重要技术取得了一系列可喜的成果,但是它们在揭示中医理论体系复杂性和内稳性方面仍存在不足.提出一种新的复杂网络的模型来探索中药方剂配伍规律,并用改进的COPRA算法对构建的复杂网络中药方剂网络进行社团发现,最后通过用自定义的模块密度来衡量所发现的社团紧密
In recent years,data clustering analysis is required by the search of several areas in intuitionistic fuzzy environment.Recently some researchers committed to present intuitionistic fuzzy C-means clus
The expressed genes of plant are often co-occurred.It is posed to biologist how to find a set of coexpressed genes that are relevant to a biological process.In this paper,we proposed a novel method to
随着DNA微阵列技术的出现,大量关于不同肿瘤的基因表达谱数据集被发布到网络上,从而为研究肿瘤特征基因选择和亚型分类提供了方便,其成为生物信息学领域的研究热点.然而,面对高维小样本的肿瘤基因表达谱数据,如何在成千上万个基因中有效地选出样本的分类特征是肿瘤基因表达谱分析中的难点问题.基于Lasso方法,提出了K-split Lasso特征选择方法,其基本思想是将数据集平均划分为K份,分别使用Lasso