【摘 要】
:
随着金融市场的不断发展,越来越多的人们通过买卖股票的形式进行投资,以期待获得更多的收益回报。但是股票的价格波动受到相应行业市场发展状况、行业新闻信息和国家宏观政策等各方面的影响,变化随机性强。如何更加准确地预测股票价格的趋势,对投资者做出投资决策起到至关重要的作用。利用股票价格数据基于算法模型来预测未来股价的趋势,可以为投资者提供投资依据。但是这样的方法没有很好地考虑到行业新闻信息对股价趋势的影响
论文部分内容阅读
随着金融市场的不断发展,越来越多的人们通过买卖股票的形式进行投资,以期待获得更多的收益回报。但是股票的价格波动受到相应行业市场发展状况、行业新闻信息和国家宏观政策等各方面的影响,变化随机性强。如何更加准确地预测股票价格的趋势,对投资者做出投资决策起到至关重要的作用。利用股票价格数据基于算法模型来预测未来股价的趋势,可以为投资者提供投资依据。但是这样的方法没有很好地考虑到行业新闻信息对股价趋势的影响,而行业新闻信息恰好反映着该行业的现状,影响投资者的投资决策,对股价趋势有着重要的影响。针对以上问题,本文基于深度学习技术,对融合股票价格特征和新闻文本特征的股票预测算法进行研究,取得以下研究成果:(1)提出了一种基于BERT和注意力机制的股票新闻文本特征提取模型。首先采用BERT对股票的新闻标题作词嵌入,来获取文本的向量化表示;再通过BERT的微调Fine-tune做语义分类任务,提取单条新闻文本的利好、利空特征向量。再引入注意力机制,为不同的新闻信息赋予不同的权值,最终得到一天综合性的新闻文本特征向量。相对于传统股票新闻文本特征提取的方式,该模型在特征提取时更好地考虑到文本上下文的含义,并考虑到多条新闻对股票的综合影响。同时,采用卷积神经网络对股票历史价格数据进行特征提取,在降低数据维度的同时有效捕获短期依赖关系。并将提取到的两类特征进行融合,作为后续预测模型的输入。(2)提出了一种基于GRU-Attention的融合多特征的股票预测模型。将融合后的股票历史价格数据特征和新闻文本特征送入该模型,利用循环神经网络GRU捕获时序中的长期依赖关系,解决了普通循环神经网络梯度消失或爆炸的问题。考虑到股票不同类别特征对股价趋势的影响程度不同,而且为了避免信息过载的问题,再次通过注意力机制聚焦重点特征信息、过滤无价值信息,进一步提高了股票趋势预测的准确率。最后,通过网易财经和东方财富股吧下载对应股票的历史价格数据和新闻文本数据构建数据集,在该数据集上对本文所提出的算法模型进行了实验验证。试验结果表明,股票的新闻信息会对股票的价格波动产生影响,当融合股票历史价格和新闻两类特征作为输入时,比只输入历史价格特征预测准确率提高了3.42%。与Word2Vec模型相比,通过BERT对新闻文本的利好、利空特征提取更加充分,预测准确率提升了1.6%。
其他文献
随着我国综合国力的不断增强以及居民生活水平的不断提高,我国的机动车保有量也呈逐年增长的趋势。机动车给人们带来方便、快捷的出行体验的同时,也带来了不可预知的风险。交通安全也成为国内外学者研究的热门领域,事故致因分析是交通安全领域重要的研究方法,但针对事故后人员状态的分析相对缺乏,因此,研究交通事故后驾驶员生存时间特征是交通安全领域重要的研究课题,对于降低交通事故死亡率、提高道路交通安全性有很大作用。
我国高速铁路蓬勃发展,列车运行速度和运输量都在不断升级,对铁路系统安全性能的要求也愈发严格,关注电磁骚扰对于列车运行的影响至关重要。而随着数字无线通信的发展,准峰值检波、有效值检波等传统的通信性能评估方法易受到检波器参数的影响,同时并不能很好的适应和满足数字无线通信传输的干扰效应评价需求。对于APD统计结果与通信系统误码性能之间的关系,学术界有很多深入研究,APD专用测量仪也不断完善。APD描述骚
选区激光熔化(selective laser melting,简称SLM)成形技术可以不使用模具直接成形结构复杂的零部件,在复杂结构零部件的制造领域表现出较强的技术优势,近年来,该技术在航空航天领域得到了广泛应用。本文以先进军用航空发动机燃烧室的制造为应用背景,系统研究了合金中C元素含量及热处理工艺对选区激光熔化成形GH3230镍基高温合金显微组织及高温力学性能的影响规律,利用相图计算软件JMat
随着我国各地城市轨道交通不断快速发展,与其相关的故障隐患问题越发突出,已经成为影响城市轨道交通正常运营状态的重要原因。各地城市轨道交通运营公司对于可能出现的故障隐患十分重视,多次开展排查整治专项活动。但故障隐患具有突发性,对于不同地区不同设备维修检修的要求都不相同,如果每次故障隐患排查都实现全部覆盖将会大大增加运营成本;同时,不同地区、不同城市的轨道交通运营公司对于故障隐患的记录标准和分级分类标准
近年来高速铁路网建设的逐步完善大大缓解了路网运能的紧张状况,但旅客运输供需不平衡情况依然普遍存在,这在高铁车站体现的更加明显。高铁车站通过能力是衡量旅客运输服务质量的重要指标,准确快捷的计算评估车站能力是找出运输能力瓶颈、提高运输服务水平的关键。目前,国内对于UIC 406普遍用其进行区间能力的计算评估,对高铁车站相关的研究较少,UIC 406原起源于欧洲,缺乏与我国高铁车站特点的结合,并且其方法
城市轨道交通作为疏解城市公共交通拥堵的重要设施,其具有快捷、准时、能耗低、运量大的优势。随着其建设进程不断加快,如何保障地铁车辆的安全运行一直是研究人员关注的热点。地铁车门作为列车的关键系统,是列车运行中故障比例最高的子系统,研究地铁车门故障诊断方法对于保障列车运行安全有重大意义。地铁车门系统故障具有潜在性、传播性和模糊性等特点,现有的故障诊断技术专注于利用传感器技术,实现对零部件潜在故障的早期识
随着经济的增长,人们逐渐提升自己的生活质量,对家装的要求也相应变高,由此,家装行业逐渐蓬勃发展起来。然而行业内部鱼龙混杂,质量标准不一,难以满足客户的家装需求。随着互联网技术的进步,家装行业逐渐与互联网技术融合在一起,提供一站式的服务,统一了家装的工作流程,提供给了客户更优质的家装服务。然而,家装行业中客户经理、顾问、设计师、管家等工作角色众多,虽然各自有相应的业务APP或平台来支持工作,但是分散
对称组合系统在机械系统中普遍存在,研究对称组合系统具有普遍意义和工程价值。本文围绕故障相关主题,从可靠性分析和维修策略优化等两个方面展开研究。(1)研究两种故障相关下的对称组合系统的可靠性分析与建模。首先,采用故障率交互作用的理论方法,在预防性维修制度下,考虑寿命数据为删失数据,定量分析了对称组合系统的两部件的故障规律,推导了不同维修措施下部件的可靠度函数,以此构建了故障率交互作用下的极大似然模型