论文部分内容阅读
多任务学习是机器学习、数据挖掘领域中一门非常重要的研究分支,旨在面对任务样本来源于不同分布且样本容量过低的情况下,促使多个任务同时学习以降低系统的泛化错误。而实际问题中面对的任务关系结构的复杂性日益增加,基于叠加模型的正则化多任务学习成为重要工具。本文以基于叠加模型的多任务学习为研究对象,开展了以下工作:1.基础模型上,首先讨论了多任务学习中挖掘任务和特征关系的必要性,创新地设计一种利用任务和特征协同聚类的多任务学习方法CoCTML,能够有效在进行多任务学习的过程中挖掘任务和特征相关联的簇结构,在形态上表现为权值矩阵的块状结构,同时利用PALM方法对该非凸问题进行优化。2.应用上,设计一种叠加的多任务学习模型对实际应用问题——轨迹回归进行建模,在能够处理路段代价动态变化的基础上,利用时间和空间的平滑性建立用户关系,并挖掘出高峰期的路段代价。设计的RDMTR方法是凸的,利用proximal方法给出优化算法。在模拟数据和真实数据上展开的实验中,本文提出的CoCTML和RDMTR均得到很好的结果,也验证了CoCTML和RDMTR的有效性。另外,对于RDMTR,通过分析叠加模型中代表额外代价的路段权值矩阵的形态,我们发现RDMTR的确能够有效还原出交通高峰期的时段,符合实际场景,验证了基于叠加模型的多任务学习方法在轨迹回归问题上的成功。