【摘 要】
:
企业在生产经营过程中可能会出现一些问题,导致企业有不同程度风险的发生。不同类型的风险对企业的影响程度不同,但都有可能给企业造成不同程度的损失。因此,企业风险评估有着实际需求。目前从各种渠道获取的企业信息包含大量的文本数据,利用文本挖掘技术进行企业风险评估有着广阔的应用前景。本文主要工作如下:第一,研究面向企业风险评估的命名实体识别方法,提出并实现了基于词典的知识增强命名实体识别方法。企业相关的文本
论文部分内容阅读
企业在生产经营过程中可能会出现一些问题,导致企业有不同程度风险的发生。不同类型的风险对企业的影响程度不同,但都有可能给企业造成不同程度的损失。因此,企业风险评估有着实际需求。目前从各种渠道获取的企业信息包含大量的文本数据,利用文本挖掘技术进行企业风险评估有着广阔的应用前景。本文主要工作如下:第一,研究面向企业风险评估的命名实体识别方法,提出并实现了基于词典的知识增强命名实体识别方法。企业相关的文本数据在描述企业名称、人名等企业信息实体时呈现多元化、复杂化的特点,针对这些文本数据的特点及风险评估的需求,提出基于词典的知识增强命名实体识别方法。该方法首先将经预处理后的文本与构建的实体词典进行匹配并对结果进行标注,将标注好的文本和之前预处理文本使用预训练语言模型转换为向量进行拼接,使用双向长短时记忆网络对拼接向量进行学习提取上下文语义特征,最后结合条件随机场完成相应的命名实体识别任务。实验表明,该方法能够解决实体多元化、复杂化等问题,为后续关系抽取等工作提供数据支撑。第二,研究面向企业风险评估的关系抽取方法,提出并实现了基于分段卷积神经网络的知识增强关系抽取方法。针对现有企业风险评估的实体关系种类较少、部分实体关系不明确等问题,提出基于分段卷积神经网络的知识增强关系抽取方法。该方法首先使用知识增强的预训练语言模型,将预处理文本和识别后的实体转换为向量,然后使用分段卷积神经网络完成企业风险评估实体关系抽取。实验表明,该方法能够较好的完成需要的企业文本数据关系抽取任务,为后续企业风险评估提供数据支撑。第三,研究企业风险评估方法,提出并实现了基于BP神经网络融入情感分析的企业风险评估方法。利用上述面向企业风险评估的命名实体识别方法和关系抽取方法的结果,并融入基于情感词典和双向长短时记忆网络的情感分析方法的结果,最终设计并实现了基于BP神经网络融入情感分析的企业风险评估算法,对上述各环节的数据进行处理,完成企业风险评估。实验表明,该方法能够较好的完成企业风险评估,具有一定的应用价值。综上所述,本文基于文本数据进行企业风险评估,深入研究并应用相关文本挖掘技术,为企业风险评估提供了新的思路与方法技术,具有一定的理论意义与实际应用价值。
其他文献
光探测器是将光信号转换成电信号(如光电流和光电压)的光电子器件,是光通信系统中对光信号进行接收和转换的不可或缺的重要器件,广泛应用于成像、通讯、探测等领域。目前,光电探测器的一个重要发展方向是集成化,这就要求人们不断开发超高速、低成本、大规模生产和集成化的光电探测器。二维(2D)材料因其显著的光耦合效应、机械柔韧性、易于多功能集成化等多种优点,被认为是构建新型光探测器的理想候选材料。本文以二维二硫
旅游特色小镇正吸引着世界各国政府机关、各类企业的广泛关注,现阶段逐渐变成了经济领域、旅游行业的研究焦点。旅游特色小镇更是公众出差、旅游、居住最为青睐的首选。伴随我国出台了大量的优惠扶持政策,旅游特色小镇在全国范围内发展迅速,但相关研究大多集中在经济发展地区,比如北京和浙江。长沙县的旅游特色小镇依旧处在摸索时期,学术界对此所做的专项研究明显不足。为推动长沙县的经济增长与社会发展,提高长沙县的经济、社
随着社会经济的发展,女性的工作能力和社会地位逐渐得到认可。然而,尽管女性的工作能力不断被肯定,但当前的高管团队中女性比例相对而言还极低,我国企业高管团队的一般现状仍然是男性高管占据绝大比例。实践证明,高管团队性别特征会影响企业双元创新。尤其是,中国人力资本质量的稳步上升,给高管们提供了更多的创新资源。因而,在此背景下,高管团队性别特征对双元创新存在何种影响?企业人力资本质量将如何影响二者之间的关系
有机电致发光器件(OLEDs)具有重量轻、体积小、主动发光、易实现大面积柔性显示与照明等独特优势,已成为新一代的环境友好绿色照明光源的重要发展方向和各先进国家节能的发展重点。因此,开发环境友好、高效的OLEDs器件是我国近年来高效率、长寿命的半导体照明产品的优先发展战略之一。OLEDs材料占据举足轻重的地位,开发新型高效的电致发光材料具有重要的研究意义。茚酮稠环类单元有弱吸电子性能,在结构上易于修
股指数据反应了整个股票市场上各类股票价格的总体趋势和变动情况,其稳定性较高、不易受人为影响的特点深受广大投资者关注。投资者根据数据波动情况来选择在合适的交易点进行买入卖出操作,从而进行获利。但绝大部分投资者无法对此进行专业的分析,缺乏策略性研究,从而错失交易信号,出现损失严重的情况。因此,本文基于机器学习、深度强化学习构建交易信号过滤模型与交易策略,以实现动态感知市场变化,帮助投资者智能化投资的需
推荐算法能够帮助用户从海量多样的数据中选择自己感兴趣的信息,可以有效地缓解信息过载问题。传统的推荐算法运用用户项目的历史交互来分析用户的兴趣偏好,因而推荐系统也面临着数据稀疏和冷启动等问题。随着网络信息的多样化,除了用户项目评分外,还有许多关于用户和项目的辅助信息如:社交网络、知识图谱等。这些辅助信息可表示成图的形式,加入到推荐系统中能够丰富用户和项目的特征,缓解数据稀疏和冷启动问题,提升推荐算法
红外成像具有抗干扰能力强,可识别伪装目标,成像距离远等诸多优势,在军事和民用领域得到广泛应用。红外成像器件用于运动平台或者拍摄运动目标时,会由于目标与相机之间的相对运动产生运动模糊,降低成像的清晰度,影响了对红外图像的后续处理。传统的图像去模糊方法通常使用模糊核先验对模糊图像进行建模,然而现实场景中的模糊图像产生的都是非均匀模糊核,传统方法估计出的模糊核具有很大的局限性,对现实场景中的复杂模糊效果
改革开放以来,县域中小企业集中集聚发展,逐渐形成具有分工合作关系的产业集群。目前部分县域产业发展主要受产业集群层次与产业链完整度制约,因此实时把握县域产业集群发展情况,对促进产业集群转型升级扶持政策的制定具有重要指导意义。本文通过深度学习技术精准识别县域内特色产业集群,构建产业图谱并完成产业链环节划分,通过对集群内部企业分布情况分析产业集群发展态势,从而提出相关发展政策建议。为解决产业集群识别过程
随着数字技术的不断发展,以及新冠疫情的影响,数字化转型逐渐渗透到人民的生活中,2022年2月发布的《“十四五”国家信息化规划》中习近平主席明确提出要建立健全有效的数字化治理体系,建设数字中国,从而打造数字经济新态势。制造业是立国之本、强国之基,是实体经济的重中之重,处处体现在人民的衣食住行中,制造业的经济命脉制约着我国经济的发展速度。如今数字经济正在蓬勃发展,为我国制造业企业转型带来了数字红利,那
社交网络提供的信息发布平台降低了信息发布标准的门槛,容易导致敏感信息在社交网络中大肆传播的安全隐患。现有的敏感实体识别模型未考虑到现实生活中,同一用户同时参与多个社交平台的情况,缺乏全面性。同时,也未考虑到社交敏感实体具有规模小、表征多、存在场景复杂等特点,获取的字词向量表示往往缺乏代表性。因此,构建多源异构社交网络场景,通过获取敏感社交信息,对数据量小且表征复杂的敏感实体进行识别,成为了命名实体