一种面向不平衡数据集的直接优化G-TP/PR算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：xiaolan

【摘要】

：

设计直接优化不平衡准则算法是克服SVM在不平衡数据集上表现不佳的一个有效途径.但已有研究多面向F1、AUC等常见标准,对于其他标准如G-TP/PR等由于优化上的困难一直鲜有涉及.

【作者】

：

程凡杨康周源江进龙

【机构】

：

安徽大学计算智能与信号处理教育部重点实验室,安徽大学计算机科学与技术学院,

【出处】

：

小型微型计算机系统

【发表日期】

：

2016年12期

【关键词】

：

不平衡数据集 SVM G-TP/PR 束方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

设计直接优化不平衡准则算法是克服SVM在不平衡数据集上表现不佳的一个有效途径.但已有研究多面向F1、AUC等常见标准,对于其他标准如G-TP/PR等由于优化上的困难一直鲜有涉及.对此,提出一个直接优化G-TP/PR的新型算法.算法采用传统SVM框架,定义了面向G-TP/PR的目标函数,该目标比已有基于F1目标更加紧凑.针对新函数非光滑,难以直接优化,提出使用束方法进行求解,使得算法的迭代次数不依赖于训练样本数,更适合大规模的应用场合.不平衡数据集上实验证明了所提算法的有效性. Designing algorithms to directly optimize unbalanced criteria is an effective way to overcome the poor performance of SVMs on unbalanced datasets, but many common standards such as F1 and AUC have been studied. For other standards such as G-TP / PR, , This paper proposes a new algorithm to directly optimize G-TP / PR.The traditional SVM framework is adopted to define the objective function for G-TP / PR, which is more than the existing goal based on F1 Aiming at the problem that the new function is nonsmooth and difficult to be directly optimized, the beam method is proposed to solve the problem, which makes the iteration number of the algorithm not depend on the number of training samples and is more suitable for large-scale applications.Experiments on unbalanced datasets prove that the proposed algorithm Effectiveness.

其他文献

2007-2009年门诊抗乙型肝炎病毒干扰素应用分析

目的:调查首都医科大学附属北京佑安医院门诊2007—2009年抗乙型肝炎病毒(HBV)干扰素的应用情况,分析评价其发展趋势,为临床合理用药提供参考。方法:对我院门诊抗HBV干扰素的

期刊

乙型肝炎病毒干扰素用药频度用药分析

基于Hub平均算法和情感分析的个性化场点推荐

随着GPS定位技术的快速发展与智能终端设备的广泛使用,基于位置的社交网络(Location-Based Social Networks,LBSNs)吸引了越来越多的用户.场点推荐是LBSNs中一个非常重要的研

期刊

基于位置的社交网络场点推荐情感分析Hub平均算法

化学事故的应急救援

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

化学事故危害后果及时控制事故应急救援组织危险物品危害程度生产规模人员伤亡化学工业波及范围危害源大灾难大社会演变生命群众清除抢

应用技术大学改革中本科学历教育与职业技能培养的关系探索 ——以黄河科技学院为例

随着知识经济时代的不断发展,人才竞争日益激烈.高等教育的现状与毕业生的就业逐渐成为了教育界关注的焦点,我国的民办本科院校逐渐将培养应用型人才作为人才培养的重要目标.

期刊

应用技术大学本科学历教育职业技能

PDM中BOM数据的MapReduce遍历查询研究

物料清单(BOM)是产品数据管理(PDM)系统中最重要的基础数据,层次复杂,版本众多,零部件数量巨大,逐步呈现大数据态.现有基于RDB的BOM查询算法,很难实现高并发的复杂层次查询,

期刊

物料清单MapReduce产品数据管理NoSQL技术矩阵

基于数学模型的科学高考志愿填报

本文对高考填报志愿系统进行定量分析,采用高斯曲线拟合、灰色预测方法给出了预测模型,利用模糊数学方法并结合正态分布和数理统计以及层次分析法设计了评价模型,以排除每年

期刊

灰色预测正态分布模糊数学层次分析法综合决策模型录取概率高考志愿填报

高校公共体育教学开展拓展训练课的实践分析

体育可以强身健体,对一个人的身体素质的增强具有很大作用.一直以来,体育教学都是学校课程教学重要组成部分.这些年来,随着教育体制的改革以及国际体育教学的不断发展,公共体

期刊

高校体育教学拓展训练

三联疗法治疗幽门螺杆菌相关性消化性溃疡的疗效观察

目的观察奥美拉唑、呋哺唑酮、阿莫西林三联疗法对消化性溃疡(PU)的治疗效果及幽门螺杆菌(Hp)的根除效果.方法对64例幽门螺杆菌阳性的消化性溃疡患者,随机分为治疗组及对照

期刊

消化性溃疡幽门螺杆菌奥美拉唑克拉霉素呋喃唑酮阿奠西林三联疗法

一种面向不平衡数据集的直接优化G-TP/PR算法

与本文相关的学术论文