【摘 要】
:
高维数据上维数灾难问题导致多种机器学习模型泛化能力下降。而线性降维具有较低计算量与较强几何解释。因此,本文在高维分类与回归任务中,面向不同模型研究相应的强泛化线性降维算法。面向k近邻分类器,提出了自适应邻域有监督判别稀疏主成分分析算法,融合有监督判别稀疏主成分分析与自适应邻域投影聚类,同时保留整体与局部结构信息进行高判别性特征提取。实验结果显示,对于k近邻分类器,该算法在各子空间维数下几乎总能取得
论文部分内容阅读
高维数据上维数灾难问题导致多种机器学习模型泛化能力下降。而线性降维具有较低计算量与较强几何解释。因此,本文在高维分类与回归任务中,面向不同模型研究相应的强泛化线性降维算法。面向k近邻分类器,提出了自适应邻域有监督判别稀疏主成分分析算法,融合有监督判别稀疏主成分分析与自适应邻域投影聚类,同时保留整体与局部结构信息进行高判别性特征提取。实验结果显示,对于k近邻分类器,该算法在各子空间维数下几乎总能取得当前最高平衡分类准确率且具有较强参数鲁棒性。面向惩罚最小二乘分类器,提出了联合自适应邻域监督判别稀疏主成分与判别分析算法,融合自适应邻域有监督判别稀疏主成分分析与惩罚最小二乘分类器,使用工具箱改进联合优化策略,端到端提取判别特征用于分类。实验结果显示,对于惩罚最小二乘分类器,该算法在各子空间维数下几乎总能取得当前最高平衡分类准确率且具有较强参数鲁棒性。进一步实验表明,无论使用k近邻还是惩罚最小二乘分类器,融合了自适应邻域有监督判别稀疏主成分分析与惩罚最小二乘分类器的该算法以更高计算代价取得了比仅使用前者相当或更强的泛化能力。面向惩罚最小二乘分类器,还提出了多视图宽度学习系统,将基于惩罚最小二乘分类器的宽度学习系统拓展到多视图场景,对各视图数据分别使用多种不同随机初始化的线性稀疏自编码器多次降维,保留增量学习特性同时避免视图间相互干扰,选择并提取多视图多样化特征。实验结果显示,相比其它单视图与多视图算法,该算法可有效提取恒河猴内侧额叶皮层辅助眼区采集的局部场电位与动作电位关于眼动决策的互补信息,显著提升了解码准确率与效率。面向Takagi-Sugeno-Kang(TSK)回归模糊系统,提出了置信度步长幂梯度下降法,在现有变学习率梯度下降法基础上增加对梯度模长的放缩,缓解高维输入与离群点带来的梯度消失与梯度爆炸问题,加速并稳定梯度下降优化进程。融合该算法与正则化等策略,可用于构建强泛化TSK回归模糊系统。实验结果显示,该算法在各规则数下均取得了当前最低均方根误差且具有较强参数鲁棒性。面向TSK回归模糊系统,还提出了一致性降维及其两个变种。一致性降维基于梯度反传自动找到规则前件与后件共享的输入子空间,端到端提取一致特征用于回归。融合一致性降维与上述优化算法,并使用网格划分初始化的共享隶属度函数,或模糊C均值聚类初始化的独立隶属度函数,可得到两种不同结构的TSK回归模糊系统。进一步融合一致性降维与自适应规则剪枝或自适应组最小绝对收缩和选择算法还得到两变种。实验结果显示,一致性降维在各规则数下几乎总能取得当前最低均方根误差且具有高计算效率与较强参数鲁棒性,两变种则以稍高计算量取得了更强泛化能力。综上,本文主要面向易受维数灾难影响的三大机器学习模型(k近邻分类器、惩罚最小二乘分类器与TSK回归模糊系统),在对应高维数据分类与回归任务中,进行强泛化线性降维算法的系统性研究。所提出的面向k近邻分类器、同时保留整体与局部结构信息的线性降维,面向惩罚最小二乘分类器、端到端提取判别特征用于分类的线性降维以及选择并提取多视图多样化特征的多视图宽度学习系统,面向TSK回归模糊系统、端到端提取一致特征用于回归的一致性降维等均取得了强大泛化能力。
其他文献
海上风电具备资源条件稳定、利用率高、距离负荷中心较近、占地少等优势,近年来已成为世界各国风电发展的重要方向。在容量较小且离岸距离较近时,海上风电通常采用交流并网方式。随着海上风电场容量及离岸距离逐渐增大,多端柔性直流系统作为解决集群化、远距离、多区域风电友好并网的有效方式,逐渐受到广泛关注。然而,由于柔直自身的特性,海陆两端交流系统之间解耦,在陆上交流系统发生频率扰动时,海上风电场无法直接感知其频
“碳中和”目标下,风电等可再生能源发电占比不断提高,使得电力系统净负荷变化更加剧烈和不确定,这对电力系统的灵活调节能力提出了更高的要求。日前调度作为电力系统运行过程中的重要环节,对合理安排灵活性资源具有重要意义。现有日前调度方法主要基于离散时间优化,将功率变化建模为阶梯曲线形式,其假设各时段内功率保持不变,时段交替时功率呈阶跃式变化,故不能准确刻画功率变化,可能导致对灵活性资源的安排不够合理。连续
职业教育集团化办学有利于实现区域内的跨界优质资源共享,有效提高技术技能人才培养质量,以及进一步推动产教融合、校企合作。在职教集团化办学的实践探索中仍存在诸多问题,如集团化办学的校企合作不够深入、集团化办学的人才培养缺乏保障、集团化办学的运行机制亟待完善。据此提出破解职业教育集团化办学困境的路径:明确职教集团法人属性,完善集团实体化运作政策;明晰多主体责权利,建立职教集团理事会制度;完善集团化办学激
蛋白质翻译后修饰(Post-translational modification,PTM)是细胞内生物学过程的最重要调控机制之一,修饰系统的异常与人类疾病高度相关。蛋白质磷酸化(Phosphorylation)和泛素化(Ubiquitination)是最常见的两种修饰类型,参与调控包括液-液相分离(Liquid-liquid phase separation,LLPS)在内的几乎所有的生物学过程,
手是人体最重要的运动器官之一,同时也是人类许多社会习俗的基础,失去手会对患者的生活与心理产生巨大的影响,使患者的生活质量显著降低。由于目前的医学水平还无法让断手重生,因此只能依靠工程技术手段为手部截肢患者研制先进的仿生假手,尽可能帮助这些患者恢复手的外观与功能。但是人手的结构与功能异常复杂,设计制造可以完全替代人手的仿生假手依旧很困难。目前的智能仿生假手在触觉感知、结构设计与优化、以及人机交互方面
脉冲强磁场核磁共振(Pulsed-high-Magnetic Field Nuclear Magnetic Resonance,PMF-NMR)测量手段兼具脉冲强磁场的物性操纵能力和核磁共振的原子级微观探测能力,不仅可以显著提高检测信噪比,还能够为发现高场诱导的奇异物态现象创造更多的可能性,但在实际应用中存在谱线质量不高、磁场与谱仪同步效率低下等问题,其根本原因是脉冲磁场的稳定度与稳态磁场还有较大
随着电子技术的迅猛发展,军事和民用领域对微波功能材料提出了更高的电磁性能需求。超材料具备灵活的结构设计特性,促进了它在电磁波调控领域的发展。本论文进行电磁超材料设计,探讨其相位调控、极化转换和电磁散射特性;开展材料本征损耗与相位对消等机制复合作用的电磁特性调控,实现雷达波宽频、高效的低反射材料设计。主要研究内容及结论如下:基于几何相位调控,研究了超材料的极化转换和电磁散射特性。设计两种单元结构:优
傅里叶叠层成像术(Fourier Ptychography,FP)作为一种先进的相位恢复技术,以相干光变角度照明为手段,将频谱搬移、相位恢复、频谱拼接以及孔径合成融为一体,利用携带冗余频谱信息的低分辨强度图像通过融合重建实现高分辨强度图像与相位信息的同步恢复,并由此突破光学系统衍射极限,在显微近场高分辨率高通量成像中获得了极大的成功。近年来,傅里叶叠层成像术在远场高分辨成像的探索已陆续出现,但依然
随着数据量的爆炸式增长及神经网络深度的不断增加,传统芯片越来越难以满足深度学习系统对算力的需求。类脑计算通过设计高效的人工突触与人工神经元直接构建硬件神经网络,从而克服传统计算机冯·诺依曼架构中存储与计算分离的瓶颈问题。然而,目前类脑计算研究主要集中在传统的确定性计算领域,缺乏对于神经网络输出结果不确定性的量化评估。通过在神经元或突触中引入随机性,概率类脑计算能够依据贝叶斯定理准确量化神经网络预测
自上个世纪九十年代以来,非制冷红外探测技术取得了重大的进展,包含了基于热敏效应的微测辐射热计、基于热释电效应的热释电探测器以及基于塞贝克效应的热电堆探测器。与制冷型的红外光子型探测器相比,非制冷红外探测器能够工作在室温条件,无需消耗额外的成本制冷,因此在性能、体积、重量和功耗等方面具有独特的优势。尽管如此,非制冷红外探测器的工作原理上基于红外光的热效应,对温度的变化进行探测,因此其本身对光强之外的