【摘 要】
:
针对既有历史数据又有流特征的全新应用场景,提出了一种基于组特征选择和流特征的在线特征选择算法。在对历史数据的组特征选择阶段,为了弥补单一聚类算法的不足,引入聚类集
【机 构】
:
南京邮电大学计算机学院,桂林电子科技大学广西高校云计算与复杂系统重点实验室
【基金项目】
:
江苏省自然科学基金资助项目(BK20131378,BK20140885);广西高校云计算与复杂系统重点实验室资助项目(15206)~~
论文部分内容阅读
针对既有历史数据又有流特征的全新应用场景,提出了一种基于组特征选择和流特征的在线特征选择算法。在对历史数据的组特征选择阶段,为了弥补单一聚类算法的不足,引入聚类集成的思想。先利用k-means方法通过多次聚类得到一个聚类集体,在集成阶段再利用层次聚类算法对聚类集体进行集成得到最终的结果。在对流特征数据的在线特征选择阶段,对组构造产生的特征组通过探讨特征间的相关性来更新特征组,最终通过组变换获得特征子集。实验结果表明,所提算法能有效应对全新场景下的在线特征选择问题,并且有很好的分类性能。
其他文献
为了综合反映启动压力和应力敏感对低渗透油藏开发规律的影响,首先,通过室内实验研究低渗透岩芯启动压力梯度和应力敏感效应,并建立启动压力梯度和动态渗透率的动力学模型;在
通过不同铅浓度下小白菜根际土壤微生物数量、硝化和反硝化速率及呼吸速率等特征的研究,揭示铅污染对植物根际微生态系统生态安全性的影响。结果表明,随着铅浓度的增加,细菌
盗用燃气类违法犯罪相较于一般盗窃违法犯罪具有其特有的复杂性,司法实践中,在认定此类行为的犯罪构成时,不仅应注意具体行为是否构成犯罪,还要注意具体行为是构成盗窃罪还是
传统会计指标存在很大的缺陷,往往容易导致投资者在对企业经营业绩进行评价及决策时产生错误,影响决策收益.EVA价值评估指标考虑企业的经济利润,即扣除债权成本和股权成本后
[目的]探讨临床路径在经内镜鼻胆管引流术病人护理中的应用效果。[方法]采用自行设计的经内镜鼻胆管引流术临床路径表对病人进行全程护理干预,比较实施前后病人置管成功率、
准确的高速公路交通事故概率预测可提高高速公路行车安全。通过分析高速公路交通事故的影响因素,建立高速公路交通事故影响因素体系,构造贝叶斯网络,提出基于贝叶斯网络的高速公
为探索坡度与不同地学要素间相关关系,选取河南省伊洛河流域8个典型县域作为研究样区,在2 km×2 km网格尺度下,以不同的仙农熵变形公式计算坡度、地表水体、土壤、城镇建设用
书法字的骨架提取即细化是书法风格研究的重要先决步骤。针对常见细化算法结果中产生的锯齿、非单像素、分叉点畸变和毛刺等问题进行改进。引入一种旋转不变性的细化算法得到
20世纪90年代以来,我国通俗史学热潮席卷神州大地,而专业史学则面临着越来越狭窄范围内的传播。读者对通俗史学的喜爱与专业史学的冷遇既反映了大众对了解历史真相的迫切需求,也
WD40蛋白质为真核生物中一种常见蛋白质,广泛参与植物生长发育的多种生物过程,在蛋白质-蛋白质及蛋白质-DNA的相互作用中发挥重要作用。为系统分析黑果枸杞WD40蛋白质家族成