论文部分内容阅读
近年来互联网+金融已成为财务预测的发展趋势,然而部分企业将自我披露的企业盈利预测夸大,投资者难以了解企业真实财务状况。因此,帮助投资者从历年财务数据中预测下一季度的数据,避免其被企业迷惑显得至关重要。基本面预测的重点是盈利预测,它能直接反映出公司当前运营状况。研究表明,我国盈利预测普遍按照具体行业进行,这导致收益较高的行业受到各界广泛的关注,而营业数值较小的行业得不到充分的关注,因此造成行业预测模型缺失。现有研究以单一行业为主,不同行业间的财务数据特征以及不同行业适用的财务数据模型是否存在差异性仍有待研究。本文针对这些问题进行了以下研究:首先,本文根据3000家不同上市公司的财务报表整合构建了61行业的财物数据,然后研究了不同行业间财务数据特征是否存在差异性。本文对构建后的财务数据进行特征统计及分析,然后判断是否存在各行业所特有的特征,并寻找这些特征与盈利之间的关联性,最后将关联度较高的特征作为后续模型选取的特征。其次,本论文研究了长短期记忆网络等七种机器学习方法并与三种归一化方法组合算法(Hybrid optimization简称H-op),它探究了在构建行业特征后不同行业是否应当采用不同的归一化和不同的机器学习算法,并将每个行业对应的最优预测方法进行展示。H-op针对不同的行业数据训练,按照金融业预测评价标准对预测方法进行比较,选择最优模型作为当前行业的预测模型。实验证明,本文提出的机器学习与多种归一化组合能得到当前最优解,预测准确率能达到96%以上。最后,本文采用上述研究结论实现了一个基于财务数据的不同企业基本面预测系统。利用H-op选取当前行业最优模型和相应的归一化方式预测此行业内不同公司下一季度的财务情况,并结合其它财务数据,对企业的风险和活力等作出判断评估,并将这些信息直观的展现出来。本文给出了各个模块的具体设计与实现,并对系统的功能和性能进行了相关测试,结果表明,本文实现的系统具有良好的预测与展示功能。