间隔分布逻辑回归及其拓展研究

来源 :南京航空航天大学 | 被引量 : 2次 | 上传用户:oswaldhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能受到来自社会和工业界的广泛关注的当代,机器学习作为人工智能中非常核心的组成部分,在众多的问题场景下发挥着巨大的作用。分类问题由于其庞大的问题覆盖范围和便捷的应用场景,一直都是机器学习领域研究的热点。线性分类器作为分类算法中的基础,由于其简单性和高效性在很多的问题中得到了成功的应用。而逻辑回归由于其概率输出的特性成为线性分类器中最主要的一个模型之一,因此对逻辑回归的拓展研究受到了很多的关注。因此,本文的主要内容安排如下:第一部分中,本文利用广义逻辑损失,通过优化间隔分布,设计了一种具有鲁棒性和泛化能力的间隔分布逻辑回归模型,并且在本文中,针对多分类的问题设计了一种多分类学习的框架并通过引入结构性稀疏约束帮助模型利用多类别之间的共享信息,在这个多分类框架下可以同时完成二分类,多分类和特征选择等任务,并为这个框架设计了相应的优化算法。此外,对于非线性分类和大规模学习,本文也给出的相应的解决方案。通过多组实验设计,验证了模型设计的多种特性包括间隔分布,噪声分析,分类能力等等。第二部分中,由于在实际的数据挖掘任务中,集成学习的性能往往要好于单个基学习器,研究将单个基学习器推广到集成学习中非常必要。对于间隔分布逻辑回归和随机子空间集成算法来说,由于噪声特征的存在会导致随机子空间存在巨大的冗余从而降低了模型性能,因此第二部分中通过引入基于聚类的剪枝思想和子空间分布的差异性度量来得到差异性随机子空间集成,降低集成模型的计算代价并保留随机子空间集成中的信息。实验表明,差异性随机子空间集成对于高特征样本比的数据尤其适用,而采用间隔分布逻辑回归的差异性随机子空间集成要更优于采用传统分类模型的算法结果。从而本文针对逻辑回归,通过引入广义逻辑损失和间隔分布,构建了一个形式简单且具有鲁棒性和泛化能力的分类模型,并在多种应用场景下进行了相应的拓展研究。
其他文献
在大规模集成电路制造过程中,化学机械平坦化(CMP)是关键工艺技术之一。钽(Ta)由于具有高稳定性、高导电性以及对铜的惰性等优势,被广泛用作铜互连阻挡层材料。铜(Cu)的化学反应活
目的食管癌是我国发病率及死亡率最高的上消化道恶性肿瘤。虽然新的治疗方法和手段不断出现,但是食管癌的总体治疗效果并不理想,尤其是对于局部晚期食管癌。单一的治疗方法难以显著提高患者的生存率,因此采用综合治疗有助于改善食管癌患者预后。本研究拟探讨新辅助化放疗联合手术治疗局部晚期食管癌的安全性、可行性以及疗效。方法前瞻性入组2013年01月至2013年12月期间在复旦大学附属肿瘤医院胸外科收治的60例局部
目的:回顾老年腰椎结核患者的临床特点,探讨老年腰椎结核患者手术方式的选择策略,总结不同手术入路、手术方法对伴有不同合并症的老年腰椎结核患者的优缺点。方法:2005年6月
集成电路(IC)是信息产业和高新技术的核心,是衡量一个国家产业竞争力和综合国力的重要标志。化学机械平坦(CMP)是IC制造的核心工艺技术之一,是目前唯一能够同时实现全局和局
目的:探讨单纯前路和单纯后路结核病灶清除植骨内固定术治疗单节段胸椎结核的临床疗效。方法:回顾性分析2013年1月~2015年12月本院收治的41例单节段胸椎结核患者资料,行单纯
随着经济社会的不断发展和民主政治的长足发展,人们的意识形态也在不断的发生着变化。民主政治的发展需要有较高素质的公民与之相适应。笔者在K中学任教三年,在这三年仔细观
研究背景:我们前期的研究表明:脊髓损伤(SCI)局部微环境中早期可检测到神经损害性的M1型巨噬细胞和神经保护性的M2型巨噬细胞,但损伤一周后M1细胞占绝对优势,而M2细胞比例则
碳纳米管(CNTs)具有良好的力学和电性能,有望应用于软电子设备领域。首先利用共价键修饰的方式对多壁碳纳米管(MWNTs)改性,之后再与聚苯乙烯-乙烯-丁二烯-苯乙烯三嵌段共聚物(SEBS)基体复合,制得一种SEBS接枝改性碳纳米管/SEBS复合材料(SEBS-g-MWNTs/SEBS)。首先将原始碳纳米管在KOH溶液中进行反应,得到羟基化多壁碳纳米管(MWNTs-OH);MWNTs-OH再与AP
目的:探究一次性游泳力竭运动、6周游泳运动、6周游泳运动后一次性力竭运动对大鼠骨骼肌氧化应激水平和内质网应激水平的影响;对比运动前、后大鼠骨骼肌氧化应激与内质网应激
目的:近年来,复合树脂以其美观、可塑性强、溶解度低等性能受到临床工作者的喜爱。因此复合树脂已逐渐成为牙科充填修复中最常用的充填材料之一。但是复合树脂聚合收缩产生微