可扩展的贝叶斯学习方法建模与推理

来源 :清华大学 | 被引量 : 0次 | 上传用户:sdwwaiwwsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多流行且实用的机器学习方法都是基于求解一个将正则化后的经验风险最小化的最优模型,比如支持向量机和矩阵分解方法等等。而另一方面,贝叶斯学习方法关注模型的概率分布,在建模上享有很强的灵活性与健壮性,在推理上也有一系列成熟的算法。因此我们希望能够将一些正则风险最小化问题转化成相应的贝叶斯学习问题,并借助后者在建模与推理上丰富的工具与手段,得到更好的学习方法。与此同时,互联网的繁荣催生出了一些新的数据类型(比如关系数据),如何扩展并利用贝叶斯方法对这类数据进行建模与分析是很值得研究的问题。而大数据时代的到来,也对贝叶斯方法的推理效率以及可扩展性提出了更高的要求。本文首先考察了如何将一个一般的正则风险最小化问题转化成贝叶斯学习问题。我们细致地比较了直接基于贝叶斯准则的传统方法以及最大熵判别方法这两种不同的实现手段,揭示了它们的一些本质区别与联系。然后,作为实践该转化方法的一个具体实例,我们考察了用于分析“用户-物品”间评分关系的最大间隔矩阵分解方法,并在将其转化得到的贝叶斯模型中进一步引入了非参数化的贝叶斯方法,从而有效地解决了隐含因子个数的选择问题。最后,我们提出了一个通用的对贝叶斯模型的后验分布进行分布式的采样近似的算法,从而极大地增强了贝叶斯后验采样方法在大数据下的可扩展性。本文的主要贡献与创新点体现在以下几个方面:1.我们通过对正则风险最小化问题的分层抽象与采用一套可推广的形式化描述方法,得到了将其转化为贝叶斯学习问题的通用且直观的一般范式。2.我们为最大间隔矩阵分解方法引入了非参数化贝叶斯方法,在学习过程中自动推断隐式因子的个数,并提高了模型的预测性能。我们借鉴了一种针对支持向量机特别设计的数据增广技术,将其运用到最大间隔矩阵分解的贝叶斯学习中,取得了一个高效的吉布斯采样近似算法。3.我们提出了一个新的分布式的贝叶斯后验采样算法。和之前的一些极端并行化的分布式采样近似算法不同,我们允许各计算节点之间通过偶尔且少量地交换消息来达到共享各自的局部后验分布的矩信息的目的,从而使得各节点最终都能得到精确的服从全局后验分布的采样样本。
其他文献
2011年11月30日,IPC(国际电子工业联接协会)2011年“热魔”杯手工焊接竞赛一华南赛区的比赛在深圳会展中心圆满落幕。在为期一天紧张激烈的比赛中,来自华南地区19家知名企业共计3
近年来,虽然我国环保事业在依法推进中快速发展,但仍存在环保理念落实不到位、环保法规不完善、执法力度待加强等问题。文章依托项目实证研究,以西安各大学校、社区为调研对象,通
热风整平工艺主要包括印制板前处理,助焊剂涂覆,浸入焊料,热风整平,热风整平后处理等,作者根据多年的实践经验,介绍了热风整平工艺技术及问题的处理方法,具有一定的实际指导意义。
高速铣削采用了较高的主轴转速和进给速度,提高了切削效率,零件的加工精度和表面光洁度也有大幅度提高,是一种完全崭新的加工技术,这项技术已越来越受到业内人士的普遍关注.
维修电工职业教育领域内的最佳拍档随着科学技术的日新月异,各种自动化设备和系统更趋先进,因此使新型维修电工的人才需求大大提高。我公司致力于开发完全符合各等级维修电工培
上海LNG调峰站采用CⅡ流程,使用HYSYS模拟CⅡ.分析自由度找出控制变量.通过API接口,将HYSYS作为服务器(Sever),编写遗传算法和模型控制程序,MATLAB环境下调用HYSYS模型进行优化
档案,是指过去和现在国家机构、社会组织以及个人,从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的