稀疏和低秩学习若干问题研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:minghui09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展开启了大数据时代。稀疏学习和低秩学习是重要的大规模机器学习方法,在许多领域得到了广泛应用,如计算机视觉、推荐系统、生物信息学等等。因此,面向互联网大数据的稀疏学习模型和低秩学习模型研究已经成为重要的课题,围绕这一主题,本文开展了以下研究工作:(1)基于筛选的多分类支持向量机加速算法:多分类稀疏支持向量机的训练是非常具有挑战性的研究问题,特别是当数据量和类别数很大时。基于其双重稀疏性和我们前期的二分类工作,我们提出了基于筛选的多分类稀疏支持向量机训练加速算法。我们的筛选方法是静态的,复合的,安全的:只需要在模型求解前运行一次就可以同时检测出大部分与最优解无关的特征变量和样本变量,缩小待求解优化问题的规模,达到提高训练效率的目的,同时不会损失模型预测精度。我们在人工合成数据集和真实应用数据集上进行了实验验证,结果表明我们的算法在模型训练效率上能取得1-2个数量级的提升。(2)基于截断核范数的在线鲁棒性主成分分析算法:传统鲁棒性主成分分析内存消耗大且无法处理流式数据。我们基于截断核范数提出了一种新的在线鲁棒性主成分分析算法。具体地,我们采用截断核范数作为矩阵秩函数的精确且鲁棒的非凸估计。我们发现了截断核范数的分解表达形式,由此可以对所得到的目标函数逐样本进行分解,进而设计了一种交替迭代优化框架以在线学习的方式求解模型。实验结果证实了我们的算法能从数据流中学习精确的低维子空间。(3)基于对称秩-1投影的单遍历稀疏主成分子空间学习方法:由于结合了稀疏性和低秩性,稀疏主成分子空间学习能得到具有良好解释性的低维子空间。我们研究了一种极端压缩感知方法即对称秩-1投影下的稀疏主成分子空间学习问题。在该观测方法下我们只能得到数据样本的一维投影幅值信息,因此,该问题具有很强的挑战性。我们提出了 一种单遍历的对称秩-1投影稀疏主成分子空间学习算法,能够以小批量迭代的方式在单次遍历数据后学习得到稀疏主成分子空间。我们的理论分析表明,在适当条件下,我们的算法能收敛到全局最优解。
其他文献
评估围垦后土壤质量的变化过程可以为土壤抑盐、培肥等调控措施提供科学指导.以不同围垦年限(5、30、38和61a)滩涂围垦区和光滩为研究对象,基于最小数据集方法筛选了与土壤质
通过对加格达奇区城市道路绿地植物造景现状的调查研究,分析加格达奇区城市道路绿化应用植物品种状况,总结道路绿化景观特色,并针对现状存在问题探讨解决途径。
成熟的诗人都有属于他自己的诗歌审美观。闻一多诗美主要体现在四个方面:诗重生命意识,但须诗境与尘境相融;诗以抒情为本,但须以理控情与情理调协;诗讲意象抒情,但须感兴与印
通过对鞍山钢铁学院与舞阳钢铁公司合作设计的27 t 大扁锭生产实践的分析,探讨了大于120 mm 板探伤不合格的原因,提出了采用双水口技术、保温帽优化设计、钢锭模内吹氩及提高
学习支持服务以有效的远程教学交互为主要内容,是保证远程教学有效发生、促使学生达到学习 目标的关键环节.有效交互包含如何关注学习内部动机、合理设计学习资源、强调教师
近年来,随着内蒙古口岸地区经济的进一步发展,与俄、蒙经济贸易往来日益活跃,大额用现钞情况普遍,现金流量增大,跨境流动频繁,为地下钱庄等洗钱活动提供了可乘之机,国际"热钱"
采用荧光光谱、紫外-可见光谱和红外光谱法,研究笃斯越橘中花青素与牛血清白蛋白之间的相互作用。结果表明:花青素对牛血清白蛋白有较强的荧光猝灭作用且为静态猝灭,并计算得出
“三言”的基本要义是一个“善”字。奉劝世人多行善举,莫作恶事是它的主题:如要做恩爱夫妻;要重情义,莫贪财等。 The basic meaning of “three words” is a “good” wor
我国助学贷款工作自2004年6月实施国家助学贷款新机制以来,取得了较大的进展,但由于助学贷款市场中存在严重的信息不对称、商业银行信用制度缺陷,以及激励约束机制和风险补偿
自从去年11月习主席宣布在上海股市推出科创板至今已满一周年,科创板已经拥有50家上市公司,总市值6870亿。科创板平均每家上市公司总市值303亿,平均流通市值32.8亿(即流通市