基于协同优化的非线性核集成方法及其应用研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:yourzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于核函数的方法是从统计学习理论中发展而来的非线性机器学习研究方法。很多线性的方法,例如特征抽取、相关性理论、分类及回归等,都可基于核化理论推广为非线性方法。“核技巧”为很多非线性问题的解决提供了一种新的思路,并被广泛应用于复杂疾病的诱因识别、基因功能相关分析、以及基因背后的非线性特征分析等领域,有着较高的理论和应用价值。然而,核函数的机器学习方法又面临着很多的挑战:核函数、核参数选择直接影响核化模型的精确性和推广能力;大数据量的核矩阵计算直接影响着核方法的运行速度;各种核方法的理论拓展和实际应用推广性能评价等问题,目前都还没有统一有效的解决方案。   本论文紧紧围绕核函数的机器学习方法,针对以上问题,结合协同进化优化思想,对常见的分类、回归、双聚类以及相关性问题进行了研究。首先,对核函数理论、各种协同进化智能技术及其应用领域发展进行了综述,指出了目前发展存在的问题以及将来的发展方向。其次,研究了核函数机制下非线性分类和回归框架;探索了基于此框架下,大数据量生物信息的分类和回归预测的应用;然后,应用核函数技巧拓展线性相关性和聚类方法,分别提出了核相关性和核双聚类方法,并将它们应用于基因调控网络和同源基因的预测研究,为探索基因信息背后的非线性特征提供了新的视角。本论文的主要研究成果体现在以下几个方面:   (1)对于分类,提出了融合数据降维、模型优化和分类三者为一体的核集成分类器。该分类器通过应用核主元分析去除复共线性噪声与冗余相关信息,进行多属性非线性降维;基于协同免疫克隆优化算法对核整体模型进行参数设置;应用支持向量机获取高维特征空间中的最优分类面。该方法可自动获取不同数据的线性和非线性分类优化模型。通过大量模式数据分类应用分析的实验结果显示,该分类器在准确性和推广性上优于线性分类器和神经网络方法,这种核集成分类模型在高维空间中会以样本最少的属性获得最好的分类效果。最后将这种核集成分类器应用于原发性开角型青光眼的鉴别,对比于临床结果和其他预测方法,试验结果显示,提出核集成分类器取得较好的鉴别精度,该方法是准确和有效的。   (2)对于回归,针对支持向量回归机核函数的不同选择,回归预测性能差异大和运行速度慢等问题,结合协同粒子群和区间划分思想,提出自适应核化粒子群支持向量回归区间预测器,并从理论和实验上探讨了这种新的区间支持向量回归机的优化性能。函数实验验证结果表明,本论文提出的全局自适应核区间预测器无论在运行速度还是在回归预测精度上,都优于一般支持向量回归,后向神经网络和三次样条曲线拟合预测方法。将其模型应用于癌患者生存预后预测,取得了较高的拟合准确度。   (3)对于聚类,提出了非线性核双聚类架构,解决了局部非线性相关信息的提取,获得了更为准确的聚类。针对最为常用的高斯核,从理论上描述了高斯核双聚类特性。结合扩展人工免疫克隆系统算法,提出了快速协同免疫克隆Memetic核双聚类(CICMKB)算法,为快速获取非线性核双聚类提供了应用基础。通过基因共调控协同信息提取实验的验证,相对于标准遗传算法和人工免疫算法算法,CICMKB算法的预测误差最小,可发现更多的双聚类基因,同时我们还给出了生物意义解释。   (4)对于相关性分析,拓展了线性Pearson相关系数到高维特征空间,提出用于检测数据间非线性交互关系的核相关系数,并给定了统计意义解释。为了评价这种核相关交互测度,基于图论构建了一种协同自适应酵母菌基因非线性调控网络。通过与经典的线性Pearson网络对比,酵母菌基因调控网络的边、节点、团等分布特征被详细分析和讨论,并解释了这些非线性基因相关性生物意义。通过对十个基因逆向工程金标准数据的对比试验,阐明核相关系数网络比互信息相关、线性相关可更准确地探测基因间功能的交互作用。核相关系数法为分析大数据高通量非线性交互特征,提供了一个高效准确有用的工具。   最后,总结了全论文的工作,指出了研究工作中存在的不足,并对今后的研究方向和研究重点进行了讨论。
其他文献
自从Reynolds首次提出经典的群体系统蜂拥模型后,不同领域的学者分别从各自角度探索了自然界的蜂拥现象所产生的原因及其可能的工程应用。近年来,随着复杂动态网络牵制控制研究
随着汽车保有量的增加,交通安全成为日益严峻的问题。疲劳驾驶会影响驾驶员的警觉能力、反应速度和安全驾驶能力,每年都会因疲劳驾驶导致大量交通事故。因此,对驾驶员的驾驶状态
在全球化经济飞速发展的今天,供应链系统的结构、环境都变得愈发复杂。虽然在国际化的市场和研究领域中对供应链风险管理的研究已逐渐形成比较成熟的体系,但是供应链仍无法完全
永磁同步电动机(permanent magnet synchronous motors, PMSM)具有体积小、噪声低、效率高、功率密度大等优点,随着电力电子技术和现代控制理论的迅速发展,PMSM得到了广泛的应用。直接转矩控制(direct torque control, DTC)以其控制结构简洁、转矩动态响应快、对电机参数依赖少等特点,已成为学术界研究的热点。本文在传统DTC理论的基础上,结合空
图像的分类与识别是人工智能领域和计算机视觉领域中一个重要的研究课题,现阶段国内外关于图像分类与识别的研究正蓬勃发展,其中应用广泛的领域有:人脸检测、场景识别、光学字符
随着医疗信息化的快速发展,药房自动化设备的研究与发展也如火如荼。但是针对中国人口多、药品发放量大、中药特殊包装存储的医药行情,国外的机械手自动化药房、储药槽式自动
DALI(Digital Addressable Lighting Interface,数字可寻址照明接口)作为照明行业的主流协议,凭借其简捷方便的控制方式、专业细致的照明效果等优点,在照明控制领域取得了广泛的应
自电力电子器件的广泛运用以来,电网的谐波污染日益严重,对高效的谐波治理技术的需求十分迫切。电力系统中存在大量突变谐波电流、零序谐波电流和高次谐波电流,这些电流进入电网
模型预测控制(Model Predictive Control, MPC)和迭代学习控制(Iterative Learning Control, ILC)是工业过程中广泛采用的控制与优化方法。文章首先分析了MPC和ILC的发展历程
三相异步电动机有着运行稳定可靠、易于维护、构造简单等优良性能,在工矿业生产和生活中占主要地位。然而异步电动机在直接启动过程中存在着启动电流大,启动转矩小的缺点,这些缺陷不仅限制了它的应用范围,也带来了电网电压降低、影响其他设备的正常工作等问题。解决这一问题的常用方法是使用软启动器,它可以调节大中型异步电动机的启动电压和电流,减轻危害程度。软启动器控制策略有很多种,但归根结底都离不开对异步电动机内部