基于自适应数据剪辑策略的Tri—training算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:YOYO654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Tri—training能有效利用无标记样例提高泛化能力.针对Tri—training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri—training(Tri—trainingwithAdaptiveDataEditing)新算法.它不仅利用RemoveOnly剪辑操作对每次迭代可能产生的误标记样例识别并移除,更重要的是采用自适应策略来确定RemoveOnly触发与抑制的恰当时机.文中证明,PAC理论下自适应策略中一系列判别充分条件可同时确保新训练集规模迭代增大
其他文献
近几年来,上海一些大型企业集团纷纷调整自己的经营战略,用已有的产业资本与高校、研究所、发达国家跨国公司的知识资本结合,以控股或参股的形式进军高新技术产业.
类似于电子计算机,数据结构能帮助DNA计算机合理、高效地组织要处理的信息.文中提出了DNA计算机中广义表的一种设计方法.首先,讨论了k-臂DNA分子的结构及其在DNA计算中的应用.接着
首先通过讨论时态XML查询数据模型TXQDM,提出了基于结点有效时间的前缀编码方案.以此为基础,引入TXQDM结点间的基于时态连通的等价关系和基于时态包含的拟序关系,建立了时态X
三得(SAMSUNG)手机新品“美丽人生”——SGH-A408(以下简称A408)作为一款专门针对女性推出的手机,一上市便引起轰动,成为热销产品,激情四射的火红外壳,令人目眩的蔚蓝背光以及专门为
从微分几何角度考察与参数化形式无关的统计模型流形的固有复杂度,指出模型流形的Gauss-Kroneker曲率可以完全刻画模型流形在一点处的全部性质,进而分析了曲率与体积的关系;
在分析了目前一些典型的社区发现算法的基础上,通过对无主题条件下的隐含社区发现算法的研究,提出将基于流的社区特征和马尔可夫图形聚类算法(MCL)的簇结合起来寻找Web隐含社区
知识经济时代的到来,要求企业界必须转变观念,积极思考对策,探讨如何利用和转化科技知识来改造和嫁接其它传统产业,以实现产业结构向高新科技领域升级;研究和制定企业自身如
优化网络资源利用是Internet流量工程的重要目标之一.最小冲突路由机制通过利用多协议标记交换(MPLS)网络中的源-目的(SD)节点对信息,在为业务流请求选择标记交换路径(LSP)时,尽可
改革开放以来,我国企业引进了许多国外技术,而现在消化吸收的项目仅占10%左右.因此,研究企业技术引进后的技术创新,对我国经济发展具有十分重要的意义.技术引进后技术创新的
党的十五大把依法治国确定为治国的基本方略,这是邓小平同志民主法制思想的重大发展,是我国治国方式的进一步完善,是社会文明进步的重要标志,是建设社会主义伟大事业的根本大