【摘 要】
:
在许多业务应用中,非平衡数据分类问题都会频繁出现,然而这个问题仍未得到很好的解决,已有的许多研究都主要集中在分类准确度上而忽略分类概率预测值的准确度。为了解决这个问题,本文提出了一种新的线性回归算法,该算法在广义线性模型的框架下,结合广义极值(GEV)分布作为链接函数以及一种被称为校准损失的函数作为目标优化函数,形成凸优化问题,利用广义极值分布的非对称性解决非平衡数据分类问题。在实现上,该算法利用
论文部分内容阅读
在许多业务应用中,非平衡数据分类问题都会频繁出现,然而这个问题仍未得到很好的解决,已有的许多研究都主要集中在分类准确度上而忽略分类概率预测值的准确度。为了解决这个问题,本文提出了一种新的线性回归算法,该算法在广义线性模型的框架下,结合广义极值(GEV)分布作为链接函数以及一种被称为校准损失的函数作为目标优化函数,形成凸优化问题,利用广义极值分布的非对称性解决非平衡数据分类问题。在实现上,该算法利用Lipschitz连续性进行了优化,使得算法的运行效率大大提升。除此之外,由于广义极值分布的形状参数对建模精度有较大影响,本文专门提出了两种参数寻优方法并对其利弊进行了讨论。在实验部分,人工生成数据集证实了参数寻优方法的准确性。而在真实数据集上,本文所提算法与其余三种常用的回归算法进行了横向对比,GEV线性回归算法表现出了优异的分类性能以及准确的分类概率预测。另外,三种最优化方法的对比实验也证实了本文所提算法在运行效率上有很大的提升。
其他文献
随着全球经济化的迅速发展,广电行业已成为建设我国经济体系的重要战略产业。目前,广电行业由于市场适应能力较弱,存在“大锅饭”现象,且来自通信运营商与互联网行业的强烈冲击导致用户流失、收入降低。而企业应用战略绩效管理进行经营管理,能在市场适应、承担社会责任、完成经营目标等方面呈现较高的管理水平。C公司作为广电行业下的一家国有企业,对战略绩效管理体系的建立和应用还待完善。因此,引入平衡计分卡进行战略绩效
本文叙述了我国近年来有关学习不良研究的主要特点和主要研究领域 ,包括诊断、鉴别以及成因等方面的成果 ,在此基础上提出了未来研究要解决的问题。
本文通过对大量鲜活事例的分析,阐述了马虎心理、文化素质欠缺和语言的复杂性是病句产生的主要原因,指出了说话和写作过程中应该注意的一些问题。
秦王朝在国家统治思想上呈现出极端的狭隘性、单维性与局限性。它表现在秦君臣对其战争力量和主观作用的深信不移和盲目夸大,以致未能及时调整"马上"与"马下"治天下的攻守异
目的对比分析持续性与间歇性血液净化治疗重症急性胰腺炎合并急性肾衰竭的临床效果。方法选取我院于2015年8月至2016年8月收治的60例重症急性胰腺炎合并急性肾衰竭患者作为研
本文以C县为例,通过对农村信用社支农工作现状的分析,寻求打破瓶径、解决问题的改进措施,探求农村信用社做大做强支农产业的有效途径。
目的:探索持续性和间歇性血液净化治疗重症急性胰腺炎合并急性肾衰竭的效果。方法:在茂名市人民医院2012年3月至2016年3月收治的重症急性胰腺炎合并急性肾衰竭患者中随机选出
随着我国婚礼回礼习俗的发展,人们对婚礼回礼礼品的需求也越来越高。近年来,在婚礼回礼这一婚礼环节中,逐渐出现了多样化、个性化的发展趋势,可与此同时的却是市场缺乏内涵和新意的回礼礼品。陶瓷属于造物材料的范畴,历史悠久,它也是文化发展的产物,对社会发展起到重要影响,甚至被称为“中国的第五大发明”。陶瓷礼器在发展过程中吸取了不同艺术精髓,不仅体现了造物者的思想,与我国的陶瓷技艺相结合,也使它在每一个发展阶
随着对海洋资源的开发和全球贸易的迅速发展,各个国家对大型船舶的使用越来越多,随之而来的是船体清刷行业的迅速发展,其中与船坞清刷相比,水下机器人清刷因其诸多方面的优势,越来越受到人们的关注。因此,本文针对船体表面清刷机器人结构和控制等方面进行研究创新,设计开发新型水下液压式船体表面清刷机器人。在对现有的船体表面清刷机器人技术进行研究的基础上,在双履带、永磁吸附和液压动力的整体方案下,设计开发液压式船
旗帜鲜明讲政治,不仅有个政治态度问题,还有个政治能力问题。军队领导干部要深入学习领会习主席关于提高政治能力的重要论述,充分认清提高政治能力的重大意义,深刻理解提高政