高斯过程回归高效近似方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shen41941395
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高斯过程是一种关于函数的分布,在机器学习领域被广泛应用于回归、分类、降维等。高斯过程回归继承了贝叶斯方法与核方法的优势,但由于时间复杂度过高,难以应用于大规模数据。现有的近似方法通常借助一定数量诱导点,来提取训练样本中的关键信息。在复杂数据上,所需诱导点数量较多,难以有效降低时间复杂度。针对这个问题,本文基于分治思想,提出了一种简单高效的近似模型,称为“重叠局部高斯过程”。方法首先将训练样本集递归划分,构建一棵三叉树,其中兄弟节点所包含的样本存在交集,交集中的样本起到诱导点的作用,可以构建相邻区域间的依赖关系。然后用每个叶结点所包含的样本建立局部高斯过程回归模型,父节点的边缘似然和预测分布可通过组合子节点的计算结果来近似,从而降低计算量。理论分析表明,对于N个训练样本,近似模型训练和预测的时间复杂度均为O(Nt),其中t与交集的大小相关,通常介于1与2之间。为进一步发挥层次诱导点的作用,本文将诱导点看作近似模型的参数,通过变分推断的方式优化每层诱导点的位置以及对应函数值的分布。优化后的诱导点可以更高效地构建区域间的依赖关系。同时,近似模型的边缘似然以及预测分布依然可以递归分解,以降低时间复杂度。理论分析表明,对于N个训练样本,如果每层诱导点数目为这一层样本数目的α次方,最终训练时间复杂度可以降为O(N)。
其他文献
多普勒流速测量为现今最常用的流速测量方法之一,其应用越来越广泛。为了加快多普勒流速计算速度、提高系统稳定性以及确保数据的实时性,本文提出了基于EtherCAT通信技术和FP
本文从核心能力——新视角出发,首先阐释了核心能力与企业价值评估之间的结构性关联,揭示出资产溢价估算是核心能力与价值评估相联结的契合点,而资产溢价估算最合适的方法就
研究背景及意义:口腔鳞状细胞癌(oral squamous cell carcinoma OSCC)是目前口腔疾病中较为常见并且疾病发病率较高的恶性肿瘤,其发病机制涉及DNA序列的不可逆性改变,这些改变包括由基因缺失、基因扩增及基因变异所引起的致癌基因的活跃和抑癌基因的沉默。目前关于OSCC的治疗方法,主要提倡包括手术治疗、放射治疗和化学治疗在内的综合治疗方式。而针对于OSCC的相关流行病学研究发