流形正则化多核模型的监督与半监督分类研究与应用

来源 :北京科技大学 | 被引量 : 1次 | 上传用户:wangzi7890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类作为机器学习最基础的学习任务之一,随着网络化信息化的发展,所需分类的数据复杂程度越来越高。多核学习因描述数据特征能力强,是复杂数据集分类的有效方法理论。从分类角度看,数据集分为输入数据部分,是数据的空间或属性信息,和相对应的输出数据部分,是数据的类别标号信息。输入数据样本,来自自然世界或工程,其往往存在固有的制约或约束关系,这种关系本质上可以用数学流形来描述。输入数据样本在其空间中所具备的流形约束,是数据的本征特征,是人来识别目标的重要信息。然而,多核分类方法尚未充分利用输入数据样本的流形约束信息。为了利用输入数据样本的流形约束信息,本文提出了一种具有输入数据样本流形约束信息的监督型的流形正则化多核分类模型。为获取输入数据样本在其空间中的流形约束信息,需要描述它们在空间中的近邻关系程度,本文应用了能细致地评价数据间近邻关系的Hellinge r(?)巨离;同时,考虑了输出数据所表达的类别标号信息作用,即同类别数据间的近邻关系程度比不同类数据间的近邻关系程度较高的一般性知识。最后,本文给出了考虑标号信息的监督型的输入数据样本流形约束的流形正则项,将其引入监督型的多核分类模型,建立了一种具有输入数据样本流形约束的监督型的流形正则化多核分类模型,给出了该模型的求解算法。监督分类仿真试验对比的结果表明,本文提出的一种具有输入数据样本流形约束的监督型的流形正则化多核分类模型是有效的。针对实际工程中,数据的输出部分普遍是有标号和无标号同时存在的事实,本文将具有输入数据样本流形约束的监督型的流形正则化多核分类模型拓展成为一种半监督的分类模型。首先,通过欧氏距离来获取全体输入数据样本之间的近邻关系,并以此得到输入数据样本的流形约束信息;然后,扩展监督型的流形正则化多核分类模型中的多核函数在全体输入数据样本下的矩阵并计算全体输入数据样本的流形约束信息的流形正则信息;从而,拓展模型成为能够综合利用有标号和无标号数据样本的一种半监督型的流形正则化多核分类模型。本文给出了这种半监督型的流形正则化多核分类模型的求解算法、误差分析和半监督分类仿真试验对比,试验结果表明了该模型在半监督分类中的有效性。针对本文给出的一种半监督型的流形正则化多核分类模型,一方面为提高该模型的自适应性和分类准确性,本文提出了半监督型的流形正则化多核分类模型中的多核函数的参数的自动选择方法;另一方面,本文改进了半监督型的流形正则化多核分类模型中的多核组合权值的约束形式,给出p范数约束多核组合权值的模型一般解。在提出的多核函数中的参数自动选择方面,本文通过改进半监督型的流形正则化多核分类模型的数学表达式并设计求解算法,将待选的核函数参数值转化为算法的解,实现自动地确定核函数参数的具体取值。在改进多核组合权值的约束方面,通过将半监督型的流形正则化多核分类模型中的多核组合权值的固定的1范数约束,改进为一般性的p范数约束,并给出了p范数约束多核组合权值的半监督流形正则化多核分类模型的求解定理及其证明。对于两方面改进后的半监督分类模型,本文分别做了半监督分类仿真试验对比。试验结果表明,本文提出的核函数参数自动选择的半监督流形正则化多核分类模型和p范数约束多核组合权值的半监督流形正则化多核分类模型是有效的。
其他文献
随着我国经济的发展,对电力的需求也越来越大,电力企业施行财务精细化管理也势在必行。本文分析了电力行业财务管理的现状,结合现状谈了一些改革的措施,并求教于同行。
我国证券市场的逐步发展,标志着我国经济运行机制已由过去单一依靠货币市场转入货币市场与资本市场结合的新的运行机制。实践证明,它已成为我国社会主义市场经济体系中不可或缺的重要组成部分, 对于推动国有企业的改革和发展, 壮大国有经济的实力, 促进市场经济的建立和完善, 开始发挥越来越显著的积极作用。但我国的证券市场仍处于发展阶段,对如何完善股票市场还缺乏经验,加上中国进行股票市场实验的独特时代背景和经济
期刊
全面预算管理模式是对企业的决策目标及资源配置加以量化,并使企业的整个经营活动协调运转的控制系统。对电力施工企业而言,实施全面预算管理不仅是加强财务管理、提高资金使
历史是人类文明的记载和传承。但有些学生认为历史知识枯燥乏味,缺乏学习热情。因此,历史老师总是想方设法改进教学方法,提高课堂效果,努力提高学生学习积极性。提高学生对历史学
大规模全局优化问题具有变量维数高,并且存在大量的局部最优解的特点。本论文主要针对大规模全局优化问题,研究可以求解该问题的高效进化算法。首先,为了减少大规模优化问题
<正>在中国社区医疗机构对神经病理性疼痛的认识不足,并且相关医务人员对患者的评估和治疗缺乏规范,按照神经病理性疼痛诊疗专家共识推荐的一线药物使用率低[1],这一现状令人
随着高分辨率天文成像和对地观测成像技术的发展,大气扰动逐渐成为制约光学系统成像质量提升的瓶颈,因此,对于去除大气干扰的需求也就越来越迫切。当光学成像系统经过大气对
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
认为贵州省煤炭国家矿产地存在勘查程度低、利用现状不容乐观等问题,提出了加大勘查投入,实施整装勘查,推行公益先行、商业跟进,推进煤炭地质勘查,以增加矿产地储备的对策。
混杂动态系统是由离散事件动态系统和连续变量动态系统相互混合、相互作用而形成的一类复杂动态系统。本论文主要考虑了几类基于有限状态自动机的混杂动态系统,即离散事件系