【摘 要】
:
随着互联网的高速发展,金融行业的业务模式也随之发生着改变。为了更好地满足年轻代的用户需求,传统金融行业巨头纷纷进军互联网投资理财领域,互联网催生了诸如东方财富、同花顺、雪球财经等互联网证券门户和社区。股民们倾向于在互联网证券社区表达自己对市场的观点,并通过各种互联网渠道搜索信息制定交易策略,产生了海量观点鲜明的文本数据。研究对金融文本数据的分析方法具有重要的商业价值。本文在研究金融文本分析方面做了
论文部分内容阅读
随着互联网的高速发展,金融行业的业务模式也随之发生着改变。为了更好地满足年轻代的用户需求,传统金融行业巨头纷纷进军互联网投资理财领域,互联网催生了诸如东方财富、同花顺、雪球财经等互联网证券门户和社区。股民们倾向于在互联网证券社区表达自己对市场的观点,并通过各种互联网渠道搜索信息制定交易策略,产生了海量观点鲜明的文本数据。研究对金融文本数据的分析方法具有重要的商业价值。本文在研究金融文本分析方面做了如下主要工作:(1)研究了金融文本数据标注方法。鉴于目前中文自然语言处理领域缺乏金融相关数据集,本文通过网络爬虫的方式采集了东方财富股吧、新浪股吧和雪球财经论坛的评论文本数据,并设计了文本数据标注算法,通过数据采集与标注生成了一份中文证券评论文本数据集(CSTD)。(2)研究了金融文本分类的新模型。对BERT模型生成的句向量进行研究与分析,使用不同卷积核大小的卷积层对句向量进行特征提取,构建了一个基于BERT的多核卷积神经网络文本分类模型(BERT-MCNN)。通过实验证明该模型在CSTD数据集上的分类效果优于传统的文本分类模型。(3)设计了面向长文本的自动摘要生成模型。本文从长文本摘要生成的核心问题出发,在研究文本序列标注和文本分类的关键技术的基础上,设计了基于BERT的抽取式自动摘要模型(BERT-DSUM),该模型能利用BERT生成文档级别向量,有效提高句子的分类精度和摘要抽取的准确性。实验证明BERT-DSUM模型对长文本生成摘要的效果优于传统的摘要生成模型。(4)在研究文本分析模型的基础上,结合金融领域的应用需求,设计并实现了金融文本分析系统(FTAS)。
其他文献
基于部分相干理论,光学相干层析成像(Optical Coherence Tomography,OCT)将光学、电子学、自动控制、数字图像处理等多门科学结合起来,成为了一种具有三维实时成像、无侵入损伤、微米量级分辨率等优点的新型生物医学成像技术。OCT适用于表征生物组织的结构与功能,以及检测相关病变的发展程度等,在皮肤科、牙科、眼科等生物医学成像领域具有重要的应用价值,被称为“光学活检”和眼底病变诊
随着底层运算能力的不断提升,计算机视觉技术也取得飞速发展。现有目标检测算法存在难以对小目标准确识别的问题,且对于处于复杂背景下、轮廓模糊的物体检测效果较差。针对上述两个问题,本文提出基于胶囊网络的无锚框图像目标检测算法。本文首先对现有目标检测算法存在的不足进行了分析,发现现有方法未考虑图像特征之间的空间关系,且对于小尺寸物体和复杂背景下的目标检测效果较差。针对上述问题,提出三点改进:首先对主干网络
弱作用重粒子(WIMP)被认为是宇宙中物质主要成分―冷暗物质的重要候选者。本论文的工作为在世界上最大的水质切仑科夫探测器―日本超级神冈探测器中尝试寻找WIMP带电激发态粒子衰变事例。2008年9月,超级神冈实验进行了数据获取系统的升级,目前处于超级神冈IV阶段。本文的工作分为三个部分:时间刻度研究、粒子鉴别研究以及WIMP带电激发态粒子的直接寻找研究。 首先,本文对超级神冈IV光电倍增管动态
随着科技的发展,协同作战已经变成了现代军事战争中海陆空防御攻击的一个发展趋势。面对天地一体化的作战任务,协同导航系统作为协同系统中一个基本的保证,为空间信息协同作战提供了主要的技术支撑。为了保证协同导航系统的独立性,必须要在测距的基础上引入节点间相对角度的测量。由于协同导航系统中的各节点的搭载能力有限,所以搭载的天线尺寸不能太大。这时就需要对基于短基线的高精度测角技术进行研究,以保证协同系统内各节
汉字的生成技术自数字化以来就开展了广泛的研究。传统的汉字生成方法从汉字的结构出发,将其拆解为单位更小的笔画,再通过排列组合形成新的汉字。此方法片面的研究了汉字的组成结构,生成的汉字通常不够自然。随着深度学习的不断发展,逐步出现了通过构造深度学习模型来研究汉字的生成方法,这些方法取得了不错的进展。但是对于风格差异更大的手写汉字而言,不仅要保证生成汉字笔画结构的正确性与完整性,还要求准确地学习到手写汉
随着企业社会责任(Corporate Social Responsibility,以下简称CSR)研究领域的发展,对CSR可能产生的经济后果已经拓展到同样重要的经济研究课题——劳动投资效率(Labor Investment Efficiency)领域。在“CSR-代理冲突-劳动投资效率”的研究理论中,CSR可能通过影响代理冲突,从而对由代理冲突引起的低下劳动投资效率产生影响。具体来说,代理冲突可能
印刷标签作为商品的标识,对其外观和内容的展示有着重要意义。在印刷标签生产过程中,由于受到各种干扰因素,不可避免地会产生一些缺陷标签。传统的人眼观察剔除缺陷标签的方式效率低下且不稳定,故实现自动化的印刷标签缺陷检测具有重要的实用价值,本课题基于此,针对彩色印刷标签进行了质量缺陷检测系统的设计与实现,主要内容包括:(1)首先对印刷标签缺陷检测现状进行了调研分析,简明介绍了缺陷检测系统实现的难点,接着介
轻质高强结构功能一体化复合材料的应用范围和使用比例,是衡量未来飞行器先进性的重要指标之一。石墨烯和碳纳米管因其优异的力-热-电-磁等特性,作为一种极富潜力的树脂增强体,被广泛应用于新型多功能纳米树脂复合材料研制。3D编织复合材料是纺织复合材料的典型结构形式,其结构整体性好,能克服传统层合结构易分层的致命弱点,具有优异的综合力学性能。本研究采用石墨烯纳米片和碳纳米管作为纳米增强体,形成石墨烯纳米片/
近年来,不管是在现代军用还是民用领域中,无人机(Unmanned Aerial Vehicle,UAV)使用的卫星导航系统多是采用GPS(Global Position System)与INS(Inertial Navigation System)组合形式,这在全球导航卫星系统GNSS(Global Navigation Satellite System)中使用率是较高的,具备良好的自导性和抗干扰
自从计算机问世以来,如何更好的进行人机交互一直是人们关注的话题,对话系统能够让机器像人类一样使用自然语言与人类交流,任务型对话系统旨在帮助用户完成特定的任务。传统方法构造的对话系统难以在数据集匮乏的场景下具备良好的性能,无法适应对话场景变化且无法回答常见问题。任务型对话系统由于能够降低对人力的消耗受到越来越多领域的关注,因此面向领域的任务型对话系统设计与研究具有重要意义。本文的目标是设计并实现适用