基于主成分分析的多变量决策树构造方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:pcxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多数决策树构造方法在每个节点上只检验单个属性,这种单变量决策树忽视了信息系统中广泛存在的属性间的关联作用,而且修剪时往往代价很大.针对以上两点,提出了一种基于主成分分析的多变量决策树构造方法,提取信息系统中的若干主成分来构造决策树.实验结果表明,这是一种操作简单,效率很高的决策树生成方法.
其他文献
通告服务是CORBA构件模型的重要服务之一。分析了一个满足CORBA规范的通告服务的体系结构,实现了基于CORBA构件模型的通告服务集成。
CILP是关系数据挖掘的主要技术之一。为提高CILP系统的效率,提出了一种基于C3模型,元学习技术和主从式静态负载平衡策略的分布式并行CILP算法,并实现了一个基于COW机群结构的分布式并行CILP原型系统。实验表明该算法是高效的,能获得较好的负载平衡,较高的加速比和并行效率。
为了满足现代企业信息的分布性、自治性和异构性,构建完全分布的工作流管理系统是亟待解决的问题。WebServices作为一种面向服务的体系架构,其突出优点是实现了真正意义上的平台独立性和语言独立性,基于此提出了一种完全分布的工作流模型,并给出了具体实现中相关问题的解决方案。
系统介绍了统计学习理论与支持向量机的基本思想,结合数字水印技术的特点,提出了支持向量机在数字水印中的几种潜在的应用方式,并就应用中相关问题进行了较为详细的论述。
对分布异构环境中的工程试验数据的有效集成是全局试验决策支持的基础。依据工程数据组织分散、模式复杂多变的特点以及OLAP和数据挖掘对数据的要求,剖析了构建数据集成元对象模型的方法、邦联式工程数据仓库的集成途径和使用元对象模型实施异构数据集成的关键技术。
在考虑到算法通用性,实现简易性,以及在扩容过程中能够改变阵列分块大小等特性,以带区为基本导向给出了一种RAID系统在线扩容方案。它的新颖之处在于:在整个在线扩容过程中只用维护新旧两份不同的磁盘阵列配置信息来实现不同RAID级别系统中的在线数据迁移,以及负载平衡等功能。
根据图像的相关性和连通性原理,利用图像各部分的梯度信息,基于原梯度倒数加权平滑算法,提出了一种改进的梯度倒数加权平滑算法。处理结果表明,改进算法较原算法能够更好地去除椒盐和随机噪声,同时较好地保持了图像的边缘和细节信息,处理过程的运算复杂度与原算法相当。改进的梯度倒数加权平滑算法为目标识别、图像分割等后继处理与分析提供了有力的支持。
首先提出了一种基于三要素(ECA特性、用户特征和任务特征)的评估ECAs的方法,该方法能作为ECAs的设计指南;然后我们用这套评估方法对一个ECA Cybelle进行了评估,指出了它的优点和不足。
基于COTS的软件开发方法日益受到重视。分析了用COTS组件来构建软件系统的优点和缺点,提出了这种软件系统开发方法需要解决的关键问题,并对COTS软件系统的体系结构及其各个部分进行详细剖析和研究,说明如何组织COTS组件来开发COTS软件系统。
首先分析了无线网络传感器的基本特性,设计了无线网络传感器硬件平台ZUSensor;然后提出了架构在ZUSensor上的微型操作系统ZUOS的基本设计要求;最后总结了微型操作系统ZUOS的基本实现方法,并重点分析了ZUOS的组件模型和通信协议。