论文部分内容阅读
函数型数据是机器学习中的一类重要的数据类型。本文研究基于函数型数据的机器学习算法,针对经济数据和医学数据提出了特征提取和预测的新的方法,针对多任务学习问题提出了多任务最小二乘正则化回归算法。本文所提算法在测试数据集上取得了优良的预测性能,并且为基于函数型数据的机器学习算法的设计提供了新的思路。 “社会消费品零售总额”是国民经济中的一项重要经济指标。本文基于我国在1984-2010年间的该项数据,设计了其长期趋势和季节性波动的特征提取方法。利用基于主微分分析的正则化回归迭代算法,将社会消费品零售总额的离散数据拟合成一个低频函数和一个高频函数之和。其中,低频函数体现了这一数据的长期变化趋势;高频函数体现了这一数据的年内季节性变化特点。进一步,在特征提取的基础上,本文提出了基于长期趋势和季节性趋势的预测方法,并将二者预测之和作为最终预测。在长期趋势的预测上,采用了平衡长期线性趋势与局部导数信息的方法;在季节性趋势的预测上,设计了前期季节性规律的加权算法。本文设计的预测方法在真实数据上取得了很好的短期预测结果。 青光眼是一种严重的眼科疾病,早期诊断困难。本文提出了基于眼底照的特征提取和青光眼预测方法。本文将眼底照中的视杯视盘轮廓线转化为能够反映局部杯盘比的连续曲线。进一步,基于这条曲线,借鉴医生的先验知识,提出了垂直杯盘比和ISNT评分两项评价指标。基于这两项指标,运用支持向量机算法对眼底照进行两分类预测。在测试数据集上,我们的方法获得了93%的预测准确率。 多任务学习的目标是借助相关任务的信息来提高目标任务的预测准确率。本文设计了多任务最小平方正则化回归算法。该算法能够利用相关任务的样本数据为目标任务选择最合适的模型参数,进而利用目标任务的样本完成对目标任务回归函数的预测。在仿真实验中,本文所提多任务学习算法能够选取更为合适的模型参数,从而取得了优于单任务学习的预测结果。