【摘 要】
:
金融业作为百业之母,与所有的行业都深深交织在一起,蕴含着海量的金融文档。虽然技术不断发展,但这些数据收集、整理和写作的工作却还是依赖人力完成。如果能使用自动化技术来完成金融报告这个繁琐费时的工作,可以减少重复的手工体力劳动,帮助金融从业者提高工作效率,从而聚焦在更有价值的工作上。然而,将深度学习技术应用到报告生成的过程中,还存在着许多问题。首先,金融报告生成属于文本生成问题,传统使用基于模板的方法
论文部分内容阅读
金融业作为百业之母,与所有的行业都深深交织在一起,蕴含着海量的金融文档。虽然技术不断发展,但这些数据收集、整理和写作的工作却还是依赖人力完成。如果能使用自动化技术来完成金融报告这个繁琐费时的工作,可以减少重复的手工体力劳动,帮助金融从业者提高工作效率,从而聚焦在更有价值的工作上。然而,将深度学习技术应用到报告生成的过程中,还存在着许多问题。首先,金融报告生成属于文本生成问题,传统使用基于模板的方法,但这种方法缺乏灵活性,当报告类型较多时,维护这些模板的成本较大。其次,报告生成由于需要基于原始提供的数据来保证生成内容的准确性,因此不能直接采用对话生成、诗词生成这类生成方法来解决报告生成问题。进一步,文本生成是一个输入简单但输出复杂的任务,问题的复杂度较高。当前所使用的方法在生成结果的质量上还有待改进。最后,在去模板化之后,如何评价生成出来的文本也是一个问题。本文通过以下工作来推动上述问题在工程应用中的解决:1)通过对金融报告自动化生成进行需求分析,设计了一个实用的金融报告自动化生成系统。该系统采用文本序列深度学习模型实现报告生成,包含数据预处理、生成模型实现、模型训练、模型评估等功能。2)针对金融报告自动化生成对现有模型进行了优化。传统的文本生成模型中,模型将输入文本看成时序文本序列,并以该时序特征为依据,来生成符合预期的文本。而基于结构化数据的data2text文本生成任务的输入文本并不会在时序上构成依赖关系。本文在选取合适的文本生成模型的基础上,再针对金融报告的特点对模型进行优化来适应这种结构化自然语言的输入,来生成更高准确度和质量的文本。3)提升金融报告生成模型的性能。随着Bert模型在自然语言处理领域任务上达到了较好成绩,而Bert模型的基本单元则使用了Transformer神经单元,其性能的优异性已被证实。本文利用Transformer来替换传统生成模型中RNN神经单元,提升了自动生成的金融报告质量。综上所述,本文设计并实现了一个金融报告自动化生成系统,并改进了datato-text文本生成模型,提升了文本生成的效果。测试结果表明:(1)与传统神经网络文本生成模型相比,本文改进的data-to-text文本生成模型具有更高的生成准确度。(2)该文本生成模型在金融报告自动化任务上具有一定的实用性。
其他文献
随着电力电子技术的快速发展,无线充电技术具有了越来越广阔的发展空间和应用前景。其中无线充电技术的可靠性和效率主要由发射芯片决定,而驱动电路又在发射芯片中起了很大的作用。且集成化芯片设计将是未来无线充电发展的主要趋势,故将驱动电路与保护电路和功率管集成在一起的驱动芯片设计将显得越来越重要。集成化的驱动芯片体积小、可靠性高、效率高。本文正是基于这种需求设计一款集成了双半桥和四功率开关的驱动芯片。本次设
近些年,卷积神经网络在计算机视觉领域的准确度得到了显著提高,然而其对存储资源、计算能力的大量需求,使其无法部署在小型设备中,需要减少卷积神经网络的参数量,降低计算复杂度。因此对卷积神经网络量化和硬件加速的研究有着重要的实用意义。本文根据卷积神经网络参数存在大量冗余信息的情况,对网络权重进行量化处理,采用增量量化算法,分组量化网络权重,将权重绝对值较大的一组量化,权重绝对值较小的一组重训练用于弥补量
蓝牙Mesh网络是蓝牙技术联盟提出的一种多对多、无中心的无线自组织网络。蓝牙Mesh网络通过中继功能,扩大了通信覆盖范围以及增强网络的鲁棒性。但在处于网络节点密度大的环境下,中继转发会产生冗余数据包,加剧消息碰撞,进一步造成网络负载严重等问题。因此,设计并实现合适的中继转发机制,以此解决冗余数据包和消息碰撞的问题是十分必要的。基于上述问题,本文在蓝牙Mesh中继功能的转发流程中,优化TTL(Tim
基于第三代宽禁带氮化镓(GaN)材料的功率半导体器件具有击穿电压高、电子迁移率高、寄生电容小及导通电阻小等优点。GaN功率器件正逐渐替代硅(Si)器件,用于开发高频、高压电子系统,满足高效高功率密度应用需求。过流保护电路对于功率器件安全可靠的工作至关重要,但是传统Si功率器件的过流保护电路无法满足GaN器件工作频率高、过流承受时间短的要求。因此,设计用于GaN器件的快速无损过流保护电路具有重要意义
随着人们对基于位置的服务的需求的不断增加,室内定位技术有着广阔的前景和商业价值。目前基于Wi-Fi的室内定位技术因设施已有广泛部署的优点获得较多应用,相较于信号强度(Received Signal Strength Indication,RSSI),信道状态信息(Channel State Information,CSI)提供了更细粒度的信息,而且受多径效应的影响小,信号特征更加稳定,因此以CSI
封装是MEMS传感器制造过程中的重要环节,能够为MEMS芯片提供机械保护、电连接、散热等功能。但同时封装结构失配也会造成封装效应,导致敏感结构的变形,影响传感器的性能。本文以硅微谐振式加速度计封装结构为切入点,研究粘接胶对硅微谐振式加速度计的影响,并进行隔离结构设计,主要工作内容如下:(1)针对芯片粘接胶的粘弹性,选择了常用于MEMS芯片粘接的硅胶、环氧树脂胶和改良环氧树脂胶制作了胶体试样,利用动
能源危机及环境污染是当前世界共同面临的难题,环保型、节约型、智能型供能网络成为能源结构升级的重要方向。随着热电联产、燃气轮机、气源热泵、电转气等设备的持续投入、基于物联网的智能城市的建设及能源互联网战略的提出,当今能源网络已经从传统电力系统逐步过渡为信息物理一体化、多能源形式耦合的综合能源信息物理系统(Integrated Energy Cyber Physical System,IECPS)。新
目标:1.描述性分析非洲国家过去20年间耐多药结核病领域的研究进展和地区分布特征。2.分析乌干达2014至2018年间耐多药结核病的流行特征及治疗效果。3.系统评价暴露于室内空气污染(IAP)和烟草烟雾与结核病(TB)感染风险之间的关联。方法:1.对2000年至2020年(4月21日)在Web of Science文献数据库中发表和索引的,非洲国家和地区人群耐多药结核病相关研究论文进行了文献计量分
新型功能性金属纳米粒子具有可设计的形貌尺寸和独特的光电特性,为微纳组装材料提供了广泛的构建基元,在柔性光电器件和表面增强拉曼散射(SERS)高灵敏检测等领域具有重大应用前景。近年来,不同维度的贵金属超晶格结构材料已被国内外科研人员相继报道并见诸于纳米材料领域的重要期刊,例如“手性纳米组装体”、“类聚合物链状阵列”以及“超晶格晶体”等一维-三维材料,多层级结构的精准构建以及新型功能性的可控设计成为了
随着码头使用年限的增长和码头不利环境作用的侵蚀,码头构件不断劣化,结构性能不断退化,在役高桩码头的整体性能安全问题不容轻视。开展高桩码头结构性能退化演变状态下的整体工作安全性研究,对在役高桩码头的使用安全与风险防控具有一定的理论意义和应用价值。本文对海洋环境中氯离子和应力联合作用下的高桩码头构件劣化与性能退化进行分析研究。结合高桩码头工程结构各构件刚度性能的退化分析,构建D-P桩土相互作用下的高桩