【摘 要】
:
监督学习问题是机器学习领域中最常见的一类学习问题,广泛存在于垃圾邮件检测、模式检测、自然语言处理、情绪分析、自动图像分类等实际中.根据预测结果的不同,监督学习又被分为分类问题和回归问题.顺序回归问题是两者之间的桥梁,在信息检索,协同过滤,医学心理学等领域中具有广泛的应用.支持向量机能够最大化分类间隔同时最小化泛化误差,是解决分类问题和回归问题的有力工具.本文在支持向量机的基础上,提出了解决三类分类
论文部分内容阅读
监督学习问题是机器学习领域中最常见的一类学习问题,广泛存在于垃圾邮件检测、模式检测、自然语言处理、情绪分析、自动图像分类等实际中.根据预测结果的不同,监督学习又被分为分类问题和回归问题.顺序回归问题是两者之间的桥梁,在信息检索,协同过滤,医学心理学等领域中具有广泛的应用.支持向量机能够最大化分类间隔同时最小化泛化误差,是解决分类问题和回归问题的有力工具.本文在支持向量机的基础上,提出了解决三类分类问题和顺序回归问题的方法,具体内容如下:第一,提出了一种解决三类分类问题的方法,即双超球支持向量数据描述.其主要思想是:当目标数据集含有三类样本时,利用第三类样本的信息对其它两类样本分别建立优化模型,使得其中一个最优超球体尽可能多的包含第一类样本点,同时拒绝其它两类样本点;另一个超球体尽可能多的包含第二类样本点,同时拒绝其它两类样本点,从而实现三类样本点的分类.通过求解两个小规模的优化问题,该方法降低了计算复杂度,减少了运行时间;通过对不同的样本类分别选取合适的核参数,该方法能够提高分类准确率.分别用人工数据和UCI数据库中的数据检验了该方法,并与一些经典的多类分类方法比较预测的正确率和计算时间,结果表明该方法是可行的和有效的.第二,提出了一种解决顺序回归问题的方法,即非平行超平面顺序回归机.该方法对于含有顺序信息的K类样本,分别找到K个方向不同的超平面,使得每类样本尽可能接近对应的超平面,达到对KK个含有顺序信息的样本进行分类的目的.利用样本的顺序信息,寻找每个超平面时,只使用相邻的两类样本作为约束条件.从而该方法只需求解K个小规模的二次规划问题,减少了运行时间.在不同的数据集上验证该方法,并与其它方法进行比较,结果表明该方法是有效的.
其他文献
现代的计算机网络,虽然发展迅速,但是在应用的过程中所产生的问题也越来越多。这对当前的互联网安全和计算机网络安全提出了巨大的要求。文章对计算机网络和互联网中存在的信
无论在旧路加铺结构中,还是新建刚性或半刚性基层沥青路面中均存在反射裂缝问题,如何防止或延缓反射裂缝的产生成为目前公路界急需解决的问题。SAMPAVE((?)tress(?)bsorbing(
目的:观察芪苈强心胶囊治疗对慢性心力衰竭患者常见中医症候的影响。方法:选取唐山市中医医院心内科门诊及住院治疗的心力衰竭患者376例,随机分为芪苈强心组200例和常规组176
低碳城市是我国面向未来、持续发展的战略选择之一,许多城市近几年纷纷提出了低碳城市建设的远景目标,并且开始付诸实施。低碳城市作为是发展低碳经济和节能减排的重要载体,
目的:通过收集国内所有有关膝关节周围骨折术后康复训练的随机和非随机对照试验,了解不同康复训练方法对膝关节周围骨折术后患者肢体功能活动度(ROM)的疗效。方法:阅读全文后
OA办公系统文件在网络传输的过程中,存在严重的安全问题。所以,想要保证OA办公系统能够广泛的在社会中进行应用,首先需要做的就是要提高OA办公系统文件传输的安全性。文章重
关于秦汉时期我国多民族统一国家的形成过程的历史探讨,对当今发展我国各民族间兄弟般的亲密关系具有现实的启迪意义。刘文瑞同志关于英、美、德创立公务员选拔制度的不同道
目的 通过对阻塞性睡眠呼吸暂停低通气综合征 (OSAHS)患者白天嗜睡的测评 ,探讨白天嗜睡在不同年龄、病情之间的发生率。 方法 采用Epworth嗜睡量表 ,对经过多导睡眠监测(
结合我国农村教育现状,分析了农村教育中存在的教育经费投入不足、教师队伍不稳定、学生辍学率高等问题,并针对性地提出了农村教育发展的措施和对策。