【摘 要】
:
CCDM 2014数据挖掘竞赛基于医学诊断数据,提出了实际生活中广泛出现的多类标问题和多类分类问题。针对两个问题出现的类别不平衡现象以及训练样本较少等特点,为了更好地完成数
【机 构】
:
南京大学计算机软件新技术国家重点实验室
【基金项目】
:
(国家自然科学基金)(江苏省自然科学基金).
论文部分内容阅读
CCDM 2014数据挖掘竞赛基于医学诊断数据,提出了实际生活中广泛出现的多类标问题和多类分类问题。针对两个问题出现的类别不平衡现象以及训练样本较少等特点,为了更好地完成数据挖掘任务,借助二次学习和集成学习的思想,提出了一个新的学习框架--二次集成学习。该学习框架通过首次集成学习得到若干置信度较高的样本,将其加入到原始训练集,并在新的训练集上进行二次学习,进而得到泛化性能更高的分类器。竞赛结果表明,与常用的集成学习相比,二次集成学习在两个问题上均取得了非常理想的结果。
其他文献
高性能计算(high performance computing,HPC)机群具有单一系统和分布式系统的双重特点,从而对机群的安全性提出了新的挑战。根据高性能计算机群的安全现状和需求,提出了一种适用
针对决策任务结构化程度越来越低,以及所需缄默知识不可编码化的难题,在基于服务的决策支持系统架构基础上,提出将人件服务应用到决策支持系统中的理念。依次介绍了面向服务
这是伸展开的卫星太阳能电池用盘压伸杆,20厘米长螺旋状的盘压伸杆打开后能达2米长。 新华社发 据新华社电 经过多年攻关,我国科学家近年来在金属玻璃的制备和机理研究上获得一系列重大进展,并成功制备出用于卫星太阳能电池等伸展机构的非晶合金材料。 非晶合金又称金属玻璃,由于其不同于晶体的特殊原子排列结构,表现出超高比强、大弹性变形能力、低热膨胀系数等特异性能,受到各国科学家重视,成为当今最活跃的
据英国《每日邮报》报道,国际空间站新长期考察组成员日本宇航员古川聪、俄罗斯宇航员谢尔盖-沃尔科夫和美国宇航员迈克-福苏姆将于7日乘坐“联盟TMA-02M”载人飞船奔赴空间站,开始为期半年的太空之旅。据了解,古川聪将在国际空间站上种黄瓜,而谢尔盖-沃尔科夫将种植土豆。 古川聪是一位医生。他表示,未来6个月期间,他将种植黄瓜,以研究未来的空间探索如何完成食品自给。“不过我们不能吃这些黄瓜。”他说。
三月好春光,杏花香四溢。3月3日,由四川成都市科协,市委宣传部,市科技局等部门共同主办的第16届“科技之春”科普活动月在青白江区洪福乡杏花广场拉开了序幕。活动当天,各种科普宣
由于最新的视频编码标准HEVC(high efficiency video coding)应用四叉树的递归结构进行编码单元的划分,使得帧间预测的过程极为复杂,编码的时间效率比较低下。针对HEVC帧间预测过
日前,江门高新区管委会正式举行首次国家政策宣讲会,向40多名企业家重点推介了国家级高新区促进科技型中小企业创新发展的相关政策,并进行了综合信息应用推介和小额贷款介绍。 目前,江门高新区有各类认定科技企业50家,结合高新区的实际情况,按照国家、省、市有关政策,园区内高新技术企业将享受有关优惠政策,比如,企业建立的省级以上工程技术研究中心和技术中心,进口规定范围内的科学研究和技术开发品,可按规定免征
判别近邻嵌入算法(discriminant neighborhood embedding,DNE)通过构造邻接图,使得在投影子空间中能够保持原始数据的局部结构,能有效地发现最佳判别方向。但是它有两方面的不足:一方面不能标识样本点的近邻样本点位置信息,从而不能更好地保持邻域结构;另一方面当数据不均衡时,不能实现子空间中类内聚合或者类间分离的目的,这不利于分类。为此提出了一种新的有监督子空间学习算法—
给出了点态化(∈,∈∨q(λ,μ))-模糊滤子和广义模糊滤子的概念,讨论了两者之间的等价关系;得到了(∈,∈∨q(λ,μ))-模糊滤子的若干等价刻画,并研究了其相关性质;讨论了(∈,∈∨q(λ,μ))-模
钻孔灌注桩基础是桥梁基础的一种主要形式,在公路、铁路等国民基建行业得到广泛应用。文章详细分析和论述桥梁桩基施工过程中的施工工艺及质量控制方法,并提出预防措施。