论文部分内容阅读
大豆是我国乃至世界第四大高质量、高营养的粮食作物,具有很高的经济和战略价值。大豆价格的波动影响了其他粮食的价格、肉类价格以及农产品市场的稳定。对大豆价格进行尽可能精确地预测,为政府根据大豆价格预测情况做出相应决策提供参考,能够在一定程度上防范大豆价格的异常波动给各方相关利益群体带来的损失。我国大豆价格受到国际市场影响,近几年国际事件的频频发生增加了大豆价格预测的难度。
本文的研究目的是在对大豆新闻进行分析的基础上,建立一个以网络新闻文本分析为基础的大豆价格预测新模型,使用深度学习方法对大豆价格进行预测。主要工作包括:
首先,对于网络新闻的文本向量化,提出了基于段落向量(Paragraph Vectors)的大豆新闻文本向量化模型,分析与大豆相关的新闻文本内容。段落向量模型用于将与大豆相关的新闻文本进行向量化,即将文字转化为能够输入预测模型的形式。
其次,提出了基于Bi-levelAttentionModel(BAM)的情感分类算法,分析大豆新闻文本所要表达的情感。利用BAM将新闻划分为积极和消极,积极新闻表示为1,消极新闻表示为-1,形成一个大豆新闻的情感值序列。BAM在测试的分类结果上优于其他六个对比模型,两个数据集上的分类准确率分别达到了88.64%和89.32%。
然后,使用长短期记忆网络分别对基于网络新闻的大豆价格多元数据集和大豆价格单变量数据集进行预测,以便对比实验效果。本文选择了四个评价指标,用以评价模型表现。这四个评价指标分别是MAE、RMSE、MAPE和调整R2。
最后,本文以黑龙江省的大豆价格为例对基于新闻的大豆价格预测方法进行实证研究。首先采用网络爬虫技术爬取了2018年8月13日至2020年9月13日期间黑龙江省大豆市场价格,以及在同一期间与大豆相关的新闻。其次,对大豆新闻进行文本向量化和情感分析,得到关于大豆的文本向量序列和情感值序列。据此建立了一个大豆多元数据集,包括大豆价格、大豆新闻文本向量和大豆新闻情感。最后将这个多元数据集作为长短期记忆网络(Long Short-Term Memory,LSTM)模型的输入,对大豆价格进行预测。本文利用LSTM分别对基于新闻的大豆价格多元数据和大豆价格单变量数据进行预测,并且将实验结果与其他模型进行比较。最终结果表明基于新闻的大豆价格多元预测结果比大豆价格单变量预测更好。在基于新闻的大豆价格多元预测结果中,RMSE为0.15,MAE为0.08,MAPE为3.03%,调整R2达到0.81。这表明基于新闻的大豆价格预测确实可以提高大豆价格预测的准确率。
本文针对长文本探讨了新闻文本分析方法,同时是首次将基于网络新闻的价格预测模型应用于大豆价格波动的研究领域,也是首次将网络新闻分析与LSTM模型结合在一起来提出一个预测大豆价格的新模型。实证结果表明基于新闻分析的价格预测模型在大豆价格上具有可行性。这为大豆价格预测提供了新的技术支持。同时,模型还可以应用于其他相似情况的农产品,为我国农产品市场的价格调控提供一些参考思路。
本文的研究目的是在对大豆新闻进行分析的基础上,建立一个以网络新闻文本分析为基础的大豆价格预测新模型,使用深度学习方法对大豆价格进行预测。主要工作包括:
首先,对于网络新闻的文本向量化,提出了基于段落向量(Paragraph Vectors)的大豆新闻文本向量化模型,分析与大豆相关的新闻文本内容。段落向量模型用于将与大豆相关的新闻文本进行向量化,即将文字转化为能够输入预测模型的形式。
其次,提出了基于Bi-levelAttentionModel(BAM)的情感分类算法,分析大豆新闻文本所要表达的情感。利用BAM将新闻划分为积极和消极,积极新闻表示为1,消极新闻表示为-1,形成一个大豆新闻的情感值序列。BAM在测试的分类结果上优于其他六个对比模型,两个数据集上的分类准确率分别达到了88.64%和89.32%。
然后,使用长短期记忆网络分别对基于网络新闻的大豆价格多元数据集和大豆价格单变量数据集进行预测,以便对比实验效果。本文选择了四个评价指标,用以评价模型表现。这四个评价指标分别是MAE、RMSE、MAPE和调整R2。
最后,本文以黑龙江省的大豆价格为例对基于新闻的大豆价格预测方法进行实证研究。首先采用网络爬虫技术爬取了2018年8月13日至2020年9月13日期间黑龙江省大豆市场价格,以及在同一期间与大豆相关的新闻。其次,对大豆新闻进行文本向量化和情感分析,得到关于大豆的文本向量序列和情感值序列。据此建立了一个大豆多元数据集,包括大豆价格、大豆新闻文本向量和大豆新闻情感。最后将这个多元数据集作为长短期记忆网络(Long Short-Term Memory,LSTM)模型的输入,对大豆价格进行预测。本文利用LSTM分别对基于新闻的大豆价格多元数据和大豆价格单变量数据进行预测,并且将实验结果与其他模型进行比较。最终结果表明基于新闻的大豆价格多元预测结果比大豆价格单变量预测更好。在基于新闻的大豆价格多元预测结果中,RMSE为0.15,MAE为0.08,MAPE为3.03%,调整R2达到0.81。这表明基于新闻的大豆价格预测确实可以提高大豆价格预测的准确率。
本文针对长文本探讨了新闻文本分析方法,同时是首次将基于网络新闻的价格预测模型应用于大豆价格波动的研究领域,也是首次将网络新闻分析与LSTM模型结合在一起来提出一个预测大豆价格的新模型。实证结果表明基于新闻分析的价格预测模型在大豆价格上具有可行性。这为大豆价格预测提供了新的技术支持。同时,模型还可以应用于其他相似情况的农产品,为我国农产品市场的价格调控提供一些参考思路。