财务指标与文本相结合的上市公司财务欺诈识别

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:daxia3301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,虽然我国对于证券市场的监管制度愈发完善,但是上市公司的财务欺诈行为并没有随着制度的完善而消失,各种财务欺诈案层出不穷。该行为不仅会造成报表使用者的利益损失,还会冲击整个市场的资本环境。在面对财务欺诈这一棘手的问题时,如何构建出准确高效的财务欺诈识别模型,成为了财务报表使用者以及市场监管者最关心的问题之一。现有研究表明,基于财务指标和财务文本能有效地识别出存在财务欺诈行为的样本。本文以上市公司财务报表数据和上市公司年度报告文本作为研究对象,搭建了财务指标与财务文本相结合的财务欺诈识别模型,主要研究内容如下。(1)大部分已有的研究都基于财务指标构建机器学习模型来判别财务欺诈行为,但是这些研究通常只使用当年的财务指标,而忽略了历史数据的作用。如公司在经营期内的营业收入指标表现出快速稳定增长的趋势,这往往是财务欺诈的预警信号,因为该指标上下浮动才是公司正常运营的表现。对此,本文将构建同时包含历史财务指标时序信息和相邻年份间财务指标变化幅度的财务指标同比矩阵,然后利用带注意力机制的Bi LSTM模型从财务指标同比矩阵中挖掘出更深层次的财务指标特征来判别财务欺诈行为。(2)近年来,部分学者挖掘财务文本信息来进行财务欺诈识别,其中大多都是从财务文本中提取出情感特征,再结合机器学习模型来识别欺诈行为。随后,有研究结合财务指标与财务文本来进行欺诈识别,并取得了较好的结果。然而,这些方法都侧重于财务文本信息的研究,不仅没有对财务指标进行深入挖掘,也未对数据融合方法进行深入探索。对此,本文一方面从历史财务指标中抽取深层次特征,另一方面用预训练语言模型对财务年报进行文本表征。最后提出多种特征融合方法来判别财务欺诈行为。首先,从公司年度报告文本中提取出“经营情况讨论与分析”这一章节。其次,将其输入到Ro BERTa模型中进行文本表征,目的是利用预训练模型强大的表征能力得到财务文本的文本表征。最后,将挖掘出的财务指标特征和财务文本表征进行融合来识别财务欺诈行为。最终实验结果表明,本文构建的财务指标与文本相结合的财务欺诈识别模型的结果具有很好的效果。
其他文献
随着数字图像处理技术和无线通信技术得到高速发展,短视频应用和流媒体平台逐渐兴起,使得人们对视频影像质量的要求日益提高,在许多应用领域中已不容忽视。但是,由于通过升级硬件来提高设备分辨率的代价和局限性较大,数码监测产品常常会在一定程度上牺牲分辨率,从而确保记录装置能够长时间地、稳定地工作,并具有适当的帧率来处理动态情况。在遥感方面,也有相似的情形,比如,在空间、频谱、时间分辨率等方面,都有一定的折中
学位
自从中本聪提出比特币和区块链概念以来,区块链技术得到了广泛关注和发展。区块链具有的防篡改、可追溯和完全去中心化等优点使其具有广阔应用场景,目前已广泛应用于多个领域,如金融、医疗、供应链、政府监管、资产管理等。但是,从事务处理角度看,区块链系统事务处理低下严重阻碍了区块链技术广泛应用。相比于传统数据库系统,区块链系统事务执行缺少并发控制,节点间存在大量事务冗余执行,系统框架上缺乏事务并行执行的设计。
学位
信息化技术的发展给远程医疗和医疗图像共享带来极大的便利,然而,医疗图像作为一种特殊且私密性较强的数字化影像,在公共网络上传输时难免被截获或篡改。患者医疗图像一旦泄露或者遭到恶意的利用和操纵,很容易导致一系列社会性问题。因此,在医疗健康领域,加强医疗图像的安全共享是必不可少的一项工作。区块链技术作为一种新兴的分布式账本,因其去中心化、去信任、不可篡改和可以溯源等特征,已被应用于医疗图像的内容保护与安
学位
随着人工智能的发展,场景几何信息的获取,例如深度图像,对高级计算机视觉任务有重要的作用,其被广泛应用于虚拟现实、无人驾驶等领域。目前主流的深度图像获取方法有两种,一种是通过立体匹配算法生成深度图像,这种方法对低纹理和遮挡区域的匹配效果不佳,另一种是通过To F传感器等设备主动感知深度值,这种方法受限于设备成本,获得的深度图像分辨率低且带有噪声。因此,为满足热门视觉任务需求,深度图像增强需求极为迫切
学位
心律失常所导致的高致死率和高致残率并发症给家庭和社会带来了沉重的负担。如何有效预防和诊断心律失常已成为当前亟待解决的问题。现有的诸多方法中,对人体心电图(Electrocardiogram,ECG)进行实时动态自动监测是一种最为有效预防和诊断心律失常的手段。在进行ECG信号自动监测时,心律失常识别准确度是最为重要的问题之一,而ECG信号特征提取是提高其识别准确度的关键步骤。然而,现有的ECG信号特
学位
随着数字媒体的发展和信息传播方式的多元化,图像逐渐成为了人们接收信息的重要媒介之一。人们在生活工作中会接触大量的图像数据,但往往只关心其中的少量信息。因此,从图像中高效快速地提取吸引人类注意力的信息是极其重要且有意义的。显著目标检测(Salient Object Detection,SOD)研究旨在从图像中快速定位和提取最吸引人类注意力的目标和区域,以帮助人们快速获取有用信息,是计算机视觉中一个重
学位
随着互联网技术的发展和普及,经济一体化浪潮的到来,电商产业获得了快速发展。同时随着网上购物逐渐进入了人们的生活中,与之密切相关的物流业务也获得了高速发展的机遇。虽然快速便捷的快递运输提高了人们的生活效率,但也带来了一些隐患,其中用户隐私泄露问题最为引人注目。目前快递运输是通过包含用户明文信息的快递单来实现的,由于贴在包裹上的快递单暴露在外,使得不法分子很容易直接或间接地得到用户信息,从而造成用户隐
学位
图像描述任务旨在生成给定图像的语言描述。该任务非常具有挑战性,因为它需要深入了解视觉和文本信息之间的关系。近年来,随着计算机视觉和自然语言处理技术的发展,图像描述任务取得了新的进展。当前,软注意力机制被广泛应用到图像描述任务中,它不仅提升了图像描述的性能,还为模型的定性分析提供视觉解释。软注意力机制根据上一时刻的单词,生成不同的权重并对图像特征进行加权融合,得到视觉注意力特征,并以此生成当前时刻的
学位
随着计算机技术和互联网技术的发展,多媒体信息的网络传输成为信息交换的主流方式,图像信息安全的关注度已经超越文本信息安全,成为信息安全领域研究的热点课题。文本信息安全已经形成了标准的密码算法,如国标SM4和美标AES等。但是,与文本信息相比,一幅图像往往具有巨大的数据量和极高的冗余度,这使得标准的文本加密算法不能直接应用于加密数字图像。近年来,由于混沌理论和DNA计算的发展,图像加密技术的研究取得了
学位
红外与可见光图像融合是将由不同传感器获得的来自同一场景的两张图像结合起来,生成一张包含两张源图像互补信息的图像。可见光传感器通过捕获反射光获得包含丰富背景信息的可见光图像,但是却很容易受到环境因素的影响。红外传感器能够克服这些因素的影响,它通过捕获来自目标的热辐射获得具有清晰轮廓但背景模糊的红外图像。因此,将红外图像中的热辐射目标信息与可见光图像的背景信息融合到一张图像,不仅更利于人眼的视觉感知,
学位