【摘 要】
:
在金融领域,企业公开发布的财务报告往往包含了企业基本信息,业务范围,经营情况,财务状况等重要的投资信息,投资者在进行投资活动时,往往会以此作为投资决策的依据,因此,财务报告这类金融文本是投资者在进行投资活动时做出投资决策的一个重要参考依据。如何通过机器学习的方法使得机器能够智能的阅读理解金融文本从而为投资者提供便利是一个重要的研究方向。金融领域的机器阅读理解任务是指给定一个问题,通过机器学习的方法
论文部分内容阅读
在金融领域,企业公开发布的财务报告往往包含了企业基本信息,业务范围,经营情况,财务状况等重要的投资信息,投资者在进行投资活动时,往往会以此作为投资决策的依据,因此,财务报告这类金融文本是投资者在进行投资活动时做出投资决策的一个重要参考依据。如何通过机器学习的方法使得机器能够智能的阅读理解金融文本从而为投资者提供便利是一个重要的研究方向。金融领域的机器阅读理解任务是指给定一个问题,通过机器学习的方法在相关文本中抽取答案来实现对问题的回答。之前提出的机器阅读理解方法多使用序列型结构模型来获取文本之间的交互信息,无法充分获取文本之间的交互信息,并且对金融领域的多文档长文本数据的处理方法并不常见。本文提出的金融文本机器阅读理解模型,能够通过阅读相关的金融文本,较好的获取问题与文本之间的交互信息,回答用户提出的问题,减少用户甄别信息的时间,辅助投资者进行投资决策。本论文的主要贡献如下:·本文采用两阶段的方式构建模型,通过引入召回阶段,并且采用可并行化的自注意力机制,大大提高了模型的训练速度。本文提出的模型通过引入召回阶段,对多文档长文本数据进行动态切分,并且进行粗召回,减少进入后续答案抽取模块的数据。并且我们摒弃了RNN,CNN等传统网络结构,采用可并行化的注意力机制,大大减少了模型的训练和推理时间。·本文通过叠加多层自注意力层获取充分的文本交互信息,并且通过设计辅助任务提高模型的阅读理解能力。通过多层注意力机制的叠加获得文本和问题的深层语义交互信息,以及引入合适的辅助任务,使得模型能够学到与阅读理解任务相关的信息。·本文构建了20万条数据的金融文本的机器阅读理解数据集。本文构建的金融文本机器阅读理解数据集,包含20万条数据,每条数据包括问题,回答,相关文本三个字段。该数据集可用于后续相关自然语言处理任务的研究。综上所述,我们针对金融文本的机器阅读理解进行了研究。构建了多阶段,基于自注意力机制的多任务学习的模型,并且在实验上证明了我们模型的有效性。我们的模型针对金融领域多文档长文本的机器阅读理解任务提供了新思路。
其他文献
目的:通过1例先天性少毛症患者的临床和病理特征总结、家系调查和基因分析,提高对先天性少毛症临床和遗传学特征的认识;初步探讨LSS基因突变与患者临床表型、病理生理改变之间的相关性及分子机制。方法:收集并分析先天性少毛症患者的临床资料并进行皮肤镜检查;采集该家系2代共4名成员的外周血,进行相关实验室检查和全外显子组测序;从NCBI数据库中获取相应突变后的羊毛甾醇合酶的氨基酸序列,将序列导入swiss-
农民工返乡创业促进了农村与城市之间信息、人才等要素的自由流动与深度融合,为现代农业和农村发展注入了新的活力。尤其是进入乡村振兴时代后,农民工返乡创业更是带动了人才、资金等回流,加快推动农业现代化发展、农村崛起。四川省地处西南腹地,是一个有名的农民工外出务工大省。近些年,由于省内创业环境的改善及外部就业压力的增大,选择返乡创业的农民工数量激增,掀起了返乡创业的热潮。但是开展创业活动实非易事,尤其是作
进入到本世纪第二个十年以来,中国经济进入了高质量发展的阶段,以人工智能为代表的新一代信息技术日益成长为经济增长的新引擎,也是各个国家互相想要占领的技术高地。人工智能作为目前最具变革的生产力因素,其对经济的发展有着不可替代的重要作用。在影响经济发展的同时,生产关系也会随之发生变化。马克思恩格斯从来都不是孤立的去研究生产关系,而是把生产关系置于生产力的研究当中。因此本文从生产关系的角度出发,研究人工智
翻译博弈论,将翻译行为纳入到社会经济的范畴进行重新考量,指出翻译即博弈——一种译者和原作者、委托人、译作读者、出版商以及其他译者之间的博弈。笔者以2019年欧盟电影展的翻译实践活动作为研究对象,从博弈论视角出发探讨译员所面临的博弈现象、翻译过程中所遇到的问题、面对问题所应选择的翻译策略,并解释陪同口译中译员口译策略选择背后的动机和原因。口译主要包括两种翻译活动——同声传译和交替传译。陪同翻译属交替
目的:检测右美托咪定作为罗哌卡因佐剂用于坐骨神经阻滞时罗哌卡因血药浓度的变化。方法:新西兰兔12只,雌雄不拘,体质量2-3kg,随机分成两组(n=6),分别为罗哌卡因组(R组)、罗哌卡因复合右美托咪定组(RD组)。每组新西兰兔耳缘静脉置管后予丙泊酚麻醉并右股静脉及左坐骨神经旁置管,R组新西兰兔在左坐骨神经旁注射0.375%罗哌卡因3ml,RD组注射0.375%罗哌卡因3ml含1.5μg/kg体质量
随着互联网的普及与发展,越来越多的人从实体店购物转向网络购物,在此过程中翻译产生的问题越来越多,如何将广告文案国际化也是这些商家目前所面临的重要难题。广告文案的特色,运用何种策略翻译达到国际化的目的,都是本文探索研究的重点。在本翻译实践报告中,笔者主要翻译和研究了选自7家女装品牌的商品文案。本篇翻译报告重点在于网络女装品牌的文案翻译,首先从词汇和句法等方面来分析女装文案的语言特色,这些文案句式多变
目的:第一部分检测Evi-1、JNK、c-Jun在结直肠癌中表达水平,并分析Evi-1、JNK、c-Jun蛋白表达与结直肠癌患者临床病理特征之间的关系,评估Evi-1在直肠癌c-Jun N末端激酶(JNK)/c-Jun通路的调控作用,探索Evi-1在结直肠癌凋亡过程中的作用。第二部分检测TRAPPC9、JNK、LC3在结直肠癌中表达水平,并分析TRAPPC9、JNK、LC3与结直肠癌患者临床病理特
随着教育信息化的迅速发展,在线教学已经成为学校教育教学的重要辅助手段。《中国教育现代化2035》明确提出要加快信息化时代教育变革。农村中学作为我国基础教育重要阵地,发展其在线教学是加快信息化时代教育变革的重要任务。农村中学在线教学管理直接影响农村中学在线教学质量,进而影响农村教育质量的提升和信息化时代教育的变革。因此,开展农村中学在线教学管理的现状研究,了解农村中学在线教学管理实施状况,通过农村中
背景:新会陈皮是在广东省江门市新会区范围内栽培的芸香科植物茶枝柑(Citrus reticulata‘Chachi’)的干燥果皮,按采收时间可分为柑青皮、微红皮、大红皮。据研究,新会陈皮具有很高的药用价值,如理气健脾、和胃止呕、燥湿化痰等,为历代众多名医家所推崇,被奉为道地药材,广泛应用于临床中药治疗以及食品、保健品、化妆品等领域。据统计,当前新会陈皮种植面积近10万亩,每年产量高达5000多吨。
随着人类对海洋与陆地衔接的浅水及滩涂等两栖环境的探索和开发,各行业对两栖开发设备的需求不断增长。水陆两栖机器人因能适应陆地、水中及水陆过渡地形等环境在科学研究、环境监测等领域有不可替代的作用。因此研究在水陆两栖复杂环境下具备良好机动能力和自主控制能力的两栖机器人对于近海领域的发展具有重要的意义。本文针对近岸浅水及沙滩等两栖环境,研究水陆两栖机器人的总体方案及其自主控制技术,主要进行以下研究工作:针