一种面向不平衡数据集的直接优化G-TP/PR算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:xiaolan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计直接优化不平衡准则算法是克服SVM在不平衡数据集上表现不佳的一个有效途径.但已有研究多面向F1、AUC等常见标准,对于其他标准如G-TP/PR等由于优化上的困难一直鲜有涉及.对此,提出一个直接优化G-TP/PR的新型算法.算法采用传统SVM框架,定义了面向G-TP/PR的目标函数,该目标比已有基于F1目标更加紧凑.针对新函数非光滑,难以直接优化,提出使用束方法进行求解,使得算法的迭代次数不依赖于训练样本数,更适合大规模的应用场合.不平衡数据集上实验证明了所提算法的有效性. Designing algorithms to directly optimize unbalanced criteria is an effective way to overcome the poor performance of SVMs on unbalanced datasets, but many common standards such as F1 and AUC have been studied. For other standards such as G-TP / PR, , This paper proposes a new algorithm to directly optimize G-TP / PR.The traditional SVM framework is adopted to define the objective function for G-TP / PR, which is more than the existing goal based on F1 Aiming at the problem that the new function is nonsmooth and difficult to be directly optimized, the beam method is proposed to solve the problem, which makes the iteration number of the algorithm not depend on the number of training samples and is more suitable for large-scale applications.Experiments on unbalanced datasets prove that the proposed algorithm Effectiveness.
其他文献
目的:调查首都医科大学附属北京佑安医院门诊2007—2009年抗乙型肝炎病毒(HBV)干扰素的应用情况,分析评价其发展趋势,为临床合理用药提供参考。方法:对我院门诊抗HBV干扰素的
随着GPS定位技术的快速发展与智能终端设备的广泛使用,基于位置的社交网络(Location-Based Social Networks,LBSNs)吸引了越来越多的用户.场点推荐是LBSNs中一个非常重要的研
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
随着知识经济时代的不断发展,人才竞争日益激烈.高等教育的现状与毕业生的就业逐渐成为了教育界关注的焦点,我国的民办本科院校逐渐将培养应用型人才作为人才培养的重要目标.
物料清单(BOM)是产品数据管理(PDM)系统中最重要的基础数据,层次复杂,版本众多,零部件数量巨大,逐步呈现大数据态.现有基于RDB的BOM查询算法,很难实现高并发的复杂层次查询,
本文对高考填报志愿系统进行定量分析,采用高斯曲线拟合、灰色预测方法给出了预测模型,利用模糊数学方法并结合正态分布和数理统计以及层次分析法设计了评价模型,以排除每年
体育可以强身健体,对一个人的身体素质的增强具有很大作用.一直以来,体育教学都是学校课程教学重要组成部分.这些年来,随着教育体制的改革以及国际体育教学的不断发展,公共体
目的 观察奥美拉唑、呋哺唑酮、阿莫西林三联疗法对消化性溃疡(PU)的治疗效果及幽门螺杆菌(Hp)的根除效果.方法 对64例幽门螺杆菌阳性的消化性溃疡患者,随机分为治疗组及对照