基于自注意力机制和历史交易信息的股票变化趋势预测模型研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:likeren1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻信息和股票交易信息是投资者判断股票变化趋势的主要来源。新闻信息相对于股票交易信息难以描述,相关研究也比较少。近年来兴起的机器学习、深度学习等技术,特别是自然语言处理技术为进行高效的文本分析提供了可能。本文通过模拟投资者综合利用新闻信息和股票交易信息来判断股票趋势的学习过程来对股票变动趋势做出智能高效的预测。
  本文首先仅考虑新闻文本信息影响力多样性因素,借鉴自然语言处理技术中的注意力机制技术,建立了层次注意力网络模型(HAN)。之后,再加入新闻文本内容相关性因素,引入自注意力机制技术,建立了带自注意力机制的层次注意力网络模型(S-HAN)。最后,引入股票历史交易信息因素,构建了混合的层次注意力网络模型(Mixed-HAN)。对这三个模型,分别构建了基于句子级别的模型和基于新闻级别的模型,形成了6个模型。实验结果表明,Mixed-HAN模型对股票变动趋势的预测准确率优于S-HAN模型,S-HAN模型的预测准确率优于基线模型HAN。效果最好的是基于句子级别的Mixed-HAN模型,达到了准确率0.8909,召回率0.5580和F1值0.6862。
  研究表明,利用自注意力机制挖掘文本之间的相关性和利用股票交易信息均能够有效提高股票变动趋势预测的准确性。另外,基于句子级别的模型在实验中的预测效果要明显优于基于新闻级别的模型。这些研究方法和结论对金融监管机构为市场提供有效的引导和预防,公司在股价波动时做出公关处理或舆论引导,或者投资机构和个人做出投资决策具有一定的参考价值。
其他文献
干旱、盐害等非生物胁迫通常导致植物失水,进而影响植物的生长发育。水分的高效率运输是维持植物正常生长的重要条件,水分在植物体内的运输通常包括水通道蛋白的调控共质体途径及其介导水分的跨膜转运。水通道蛋白是主要内在蛋白超家族(MIPs)中的一员,广泛存在于多种植物中。水通道蛋白不仅参与植物体内的多种生物过程,同时在逆境胁迫响应中有积极的调控作用。小盐芥是一种生长于滨海盐渍土中的典型盐生植物,具有极强的耐盐能力,本研究利用从小盐芥中克隆的2个水通道蛋白TsPIP1;1基因及TsTIP1;1基因分别转化水稻模式植物
农业是国家市场经济发展的关键组成部分,同时也是国家经济获得支撑的核心产业,农业的可持续稳定发展对于提高人民的生活质量具有举足轻重的作用。当前,为了加速国家农业的长远发展,提高国家经济建设水平,各个农业部门与地方政府也逐渐开始了推动农业产业转型改革的步伐,对于农业发展当中遇到的各种问题积极进行优化和解决,并依靠“互联网+”背景深入对新时代发展时期的农业经济建设进行探索。利用信息化技术来创建与农业经济
期刊
高良姜为姜科多年生植物高良姜(AlpiniaofficinarumHance)的干燥根茎,是我国大宗药材,“十大南药”之一,在医药、食品、化妆品及蔬果保鲜上有广泛的应用。目前高良姜人工栽培资源成为药材主要的商品来源,但其种植标准化程度低,农家栽培类型多样,高良姜种苗质量及栽培类型关系到大田生产的产量和质量。因此规范高良姜种苗质量并通过转录组分析4种不同栽培类型高良姜差异表达的基因,为后续开展分子标记辅助育种、基因工程技术选育创制新的药用高良姜优良品种、改善高良姜品质以及指导栽培育种奠定基础。
  本
目前两亲性透明质酸衍生物作为药物递送系统在生物医药领域具有深远的研究应用潜力。透明质酸衍生物是通过化学键等方法将药物接枝在透明质酸亲水链上,改善难溶性药物的溶解度,提高药物的稳定性,延长药物在血液中的循环时间,减少药物毒副作用,从而增强药物的治疗效果,提高药物的生物利用度。本课题在透明质酸衍生物的结构中引入pH敏感分子结构,将姜黄素接枝在透明质酸链上,得到具有pH敏感刺激响应的纳米粒,同时透明质酸是肿瘤细胞高表达的CD44受体的配体,因此,该递药系统能够主动靶向肿瘤区域及促进肿瘤细胞摄取,实现抗肿瘤治疗目
新时期以来,我国日益强调农业经济管理的现代化、职业化、创新化,以期加快新型职业农民的培育以及农业经济管理优化策略的应用进程。由王培志主编的《农业经济管理》一书是系统论述现代农业经济管理理论与实践体系的学术专著,对促进我国农业经济管理人才的专业化培养,加快新时期我国农业经济管理策略的专业性优化进程,有一定的参考价值。  该书在内容上共包括十一章:第一章导论,整体上阐述了农业在国民经济中的地位和作用,
期刊
近年来,我国电子商务行业蓬勃发展,网络购物已经成为现代商业活动的重要组成部分。随着网购用户规模和网络零售额的快速增长,各大电子商务网站的商品数量已经呈爆炸式增长,网购用户遇到比较严重的“信息过载”问题,在制定购买决策时往往存在很大的不确定性。一方面,在线用户在网络购物过程中存在“信息迷失”现象,往往缺乏足够的知识和时间去做出合理的决策;另一方面,在电子商务平台上,网购用户可以很容易观察到其他人的选择。众多电子商务平台都通过提供商品排行榜和在线评论信息等为在线消费者的购买决策提供支持。在这种情况下,在线用户
电力负荷预测在电网管理中发挥着越来越重要的作用。尤其随着海量居民用户级负荷序列得以采集存储,精确的负荷预测将有助于进一步优化机组调度计划,降低启停成本。目前,较多研究将用户聚类分析作为区域负荷预测的预处理步骤以提高负荷预测精度。但其主要聚焦于单值负荷预测,而未考虑区间负荷预测和概率负荷预测。区间负荷预测和概率负荷预测可提供更为全面的预测值分布,对调度决策具有重要意义和价值。本文将基于聚类分析的区域单值负荷预测框架扩展至区间负荷预测和概率负荷预测,探究不同聚类方法、聚类相似性度量方式以及聚类个数对区间负荷预
互联网技术的发展促进了社会化媒体的飞速发展,为信息的有效传播和积累增长带来空前的助力,因此信息的质量问题受到了大量关注和讨论。作为一种典型的社会化媒体形式,社会化问答(Social Question and Answering, SQ&A)平台上积累了用户发布的海量信息,其中用户生成问题(User-generated Question, UGQ)是用户在平台中发起的问题条目信息,其质量问题不容忽视。现有研究在回答内容的质量方面做出了大量讨论,而对UGQ质量的研究却甚少。UGQ质量的有效度量对平台规范管理、
随着制造技术和信息技术的进步,愈加白热化的全球竞争和时尚趋势,以及消费者对产品的独特性需求日益增加,越来越多的企业开始探索消费者参与的产品定制。但是消费者参与大规模定制面临两个决策问题:一是企业在满足消费者溢价偏好和生产成本效率之间的权衡;第二,消费者在根据自己的需求定制产品和交互成本之间进行权衡。
  本研究的第一部分是消费者参与企业大规模定制战略的影响研究,将消费者融入制造商的定制过程,并将企业与顾客的互动程度定义为大规模定制的水平,建立Hotelling模型结合了企业和消费者在交互过程中所面临
当今如此众多的电视品牌,想要在激烈的市场环境中站稳脚跟,就离不开销量预测。目前,大部分企业对于产品的销售预测是依靠决策人员对产品的认识以及前期的经验,具有一定的盲目性和随意性,无法合理的安排生产和采购物料。本文拟采用循环神经网络及注意力机制对某企业的电视品类销量数据进行合理预测。
  循环神经网络作为时序数据预测中较为主要的手段,在很多数据预测领域已经有了一定的应用。本文选取某企业电视品类的销量数据进行预处理,剔除离群点数据并进行归一化处理,构建循环神经网络中的RNN、LSTM、BLSTM三种模型,