【摘 要】
:
随着互联网的快速发展,社交媒体上充满了大量的用户数据信息,如何更好地对这些信息进行有效挖掘、利用、监督管理,受到越来越多研究学者的关注。命名实体识别任务是自然语言
论文部分内容阅读
随着互联网的快速发展,社交媒体上充满了大量的用户数据信息,如何更好地对这些信息进行有效挖掘、利用、监督管理,受到越来越多研究学者的关注。命名实体识别任务是自然语言处理任务中的一个基础性工作,对后续研究工作的顺利开展起到了关键性作用,因此面向用户生成内容的命名实体识别有着非常重要的意义。本文采用外部知识方法对用户生成内容进行命名实体识别,主要研究内容分为以下两个部分:1.由于用户生成内容文本数据具有噪音和非规范化特点,并且文本数据中实体的数量较少,这使得神经网络在训练时实体语义信息匮乏,导致了命名实体识别的准确率不高。为了提高识别效果,本文在Bi-LSTM-CNNs-CRF模型基础上设计一种改进的方法,即基于外部知识增强的神经序列标注模型(Knowledge-enhanced Neural Sequence Labelling Model,KNSLM)。通过在神经网络模型中构建外部知识层,引入外部信息帮助模型识别更多的实体,并且设计了外部实体知识获取方法及其融合方法。该方法在用户生成内容数据集上进行对比实验,实验结果表明,当实体数量为20000个实体向量融入KNSLM模型时,其识别的精确率、召回率、F1值均有所提高。同时也验证了随着外部实体数量的增加,KNSLM模型的识别效果也会提高。2.由于命名实体识别方法大部分都是采用LSTM等循环神经网络,但是该网络所消耗的时间较长,对处理长距离依赖问题效果不好。Transformer算法相比较于LSTM更能显示出特征提取的高效性,并且基于Transformer算法的预训练模型更好适用于下游任务,但是预训练模型很少考虑到外部知识信息。为了将知识图谱信息融合到预训练模型中去,本文设计了一种外部知识融合方法,最后将融合知识的预训练模型运用在面向用户生成内容的命名实体识别任务中。实验结果表明,相比较于没有融合知识的预训练模型,命名实体识别的效果有一定提高。
其他文献
近年来随着人工智能领域的飞速发展,强化学习算法作为人工智能领域的经典算法受到了广泛的关注与研究。而稀疏奖励问题作为强化学习算法面临的主要挑战,因为其与实际生活中面
红脂大小蠹(Dendroctonus valens LeConte 1860)原产北美,是我国重大外来入侵生物之一,是全国林业检疫性有害生物,对我国油松造成严重危害。自上世纪八十年代传入山西以来,红脂大小蠹在我国迅速扩散并造成了严重的经济与生态损失。本研究试验地点位于内蒙古自治区赤峰市宁城县黑里河国家级自然保护区,保护区内分布有大面积天然油松林。该保护区为红脂大小蠹向北扩散中的新分布区,目前尚处于
传统永磁电机在高速运行时,输出功率达不到想要的需求,而最近一些采用高剩磁、低矫顽力的永磁材料的记忆电机得到了国内外广泛的研究。轴向磁场永磁记忆电机(AFMM)是一种新型可控永磁记忆电机。该电机同时具有记忆电机磁通可控和轴向磁场电机效率高的特点,在生活中的各个领域具有广泛的使用前景。本文主要对轴向磁场记忆电机的调磁控制进行研究,通过对电机的结构和运行原理的研究,提出一种较好的控制电机的方法。本文主要
近年来,遥感技术发展迅猛也更广泛地运用到了我们的实际生活应用中,遥感图像融合也受到了更多的重视,其中遥感图像融合中的多光谱和全色图像融合得到了更多的研究与关注。该
近年来,随着我国经济的高速发展,大型水利工程相继筹划、施工建设以及投入运营,所涉及的岩石力学问题也越来越复杂。由于岩体内部孕育着不同结构特征的地质结构面,对岩体破坏起着控制作用,使得岩体稳定性问题变得更为复杂。从已有的工程实例中可以发现,岩体工程的失稳破坏主要是由于外部荷载作用致使结构面演化、扩展以及贯通造成的。因此,研究受荷裂隙岩体的破坏特性对于揭示岩体工程稳定性问题有着重要的工程意义,同时也是
金属-有机骨架(MOFs)材料具有纳米级的规整的骨架型孔道结构,它具有高结晶度,更大的比表面积,更高的孔隙率及固体密度小,存在强的金属—配体的相互作用,同时它的结构和功能也更
现如今,机器人技术已广泛应用于生产生活中的诸多领域,成为世界各国的研究热点。另一方面,随着我国人口老龄化加速,医护人力不足以满足医疗护理的需求。应用机器人技术解决实
车载自组织网络(Vehicular Adhoc Networks,VANETs)承载两类主要应用业务,一类是安全应用,一类是用户应用。其中安全应用关系车辆、人员安全,对数据传输性能要求严苛;用户应用为用户提供娱乐等增值服务,需要满足用户的个性化需求。由于VANETs中车辆密度不均、节点高速变化等特点,造成网络拓扑变化剧烈、通信链路不稳定,导致数据传输性能下降。特别在高速公路环境下,路边单元(Roa
随着大数据时代的来临,提升对大规模数据的认知能力是技术发展的迫切需要。针对认知计算领域内的单一人工神经网络存在结构大、解释性不强、时间复杂度高等问题,本文将大脑“
传统的正向创新由发达国家跨国企业发起,在发达国家完成原始研发和初次产业化,随后将新产品向新兴国家市场输出。逆向创新指的是后发企业根据新创意在本土完成新产品研发,却