基于正则化互信息和差异度的集成特征选择

来源 :计算机科学 | 被引量 : 0次 | 上传用户:adamadama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何构造差异性大的基分类器是集成学习研究的重点,为此提出迭代循环选择法:以最大化正则互信息为准则提取最优特征子集,进而基于此训练得到基分类器;同时以错分样本个数作为差异性度量准则来评价所得基分类器的性能,若满足条件则停止,反之则循环迭代直至结束。最后用加权投票法融合所选基分类器的识别结果。通过仿真实验验证算法的有效性,以支持向量机为分类器,在公共数据集UCI上进行实验,并与单SVM及经典的Bagging集成算法和特征Bagging集成算法进行对比。实验结果显示,该方法可获得较高的分类精度。
其他文献
暴露在太空辐射环境下的星载计算机,其电子元器件可能因受到高能带电粒子的轰击而造成硬件系统的瞬时故障,所以,需要使用容错技术来提高其可靠性。对一种面向硬件瞬时故障的
大豆新品种宁豆6号主要特点是高产、稳产、适应性好。2015—2016年宁夏区域试验平均产量4 358.25公斤/公顷,较对照承豆6号增产3.8%。2017年生产试验平均产量3 956.1公斤/公顷
济J12105是济宁市农业科学院选育而成的高油、抗病、抗倒伏,落叶干净,丰产性好,籽粒商品性好的夏大豆新品种,该品种2018年通过天津市农作物品种审定委员会审定,审定编号:津审
针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-ArrayTrie)的规则串提取方法。该方法针对B2B系统中“参数名:参数值”字符串的规则特征构建
农庆豆20为抗胞囊线虫大豆新品种,区域试验平均产量2 497.6公斤/公顷,较对照品种增产8.0%。该品种需≥10℃积温2 450℃左右,出苗至成熟生育日数118天左右,黑龙江省品种试验表
在高层的数据融合中,往往需要能够觉察和预测态势的变化趋势。因为由多个智能代理构成的交互系统,其态势的变化是靠各方的决策活动推动的,所以纯粹概率的或证据的技术对这类预测
求解最近点对问题在诸如地理信息查询、空间数据库等领域应用广泛。但到目前为止,还没有一种高效的求解算法,如传统求解最近对的分治算法存在比较次数较多、阈值收敛速度慢、计算距离次数较多的缺点。基于网格技术的求解最近邻方法存在网格的大小难以确定和算法效率低的问题。据此,首先提出基于单向检测的最近对求解算法(CP_SDD),然后提出按行划分的排序算法(RDS),最后得到基于分行排序单向检测的最近对求解算法(
首先提出一种改进的算法NONEPI++,用于挖掘事件序列上非重叠发生的频繁情节;然后将每个频繁情节表示为相应的情节隐马尔可夫模型EHMM,并通过最大期望算法计算模型的混合系数,
2018年9月21日,由中国农业科学院作物科学研究所和宿州市人民政府主办的中黄13一亿亩收获暨国家大豆良种攻关黄淮海现场会在安徽省宿州市召开。农业农村部副部长余欣荣、中国
为了在云计算环境下进行虚拟机迁移,Xen迁移时采用比较传递页位图和跳过页住图的方式来判断内存页是否重传。针对页位图比较带来多次重传增加网络传送开销的问题,提出基于AR模