【摘 要】
:
关系抽取是信息抽取技术中的一项重要任务,也是知识图谱构建过程中的重要环节,其目的是从非结构化的文本中抽取出结构化的三元组知识。这一技术有着极大的商业价值和落地需求,然而现有的关系抽取系统在落地实现的过程中,普遍面临着两大问题的挑战——冷启动数据需求问题和运行中增量数据处理问题。近年来,越来越多的研究者开始关注这些问题,少样本关系抽取技术在应对冷启动数据需求问题上取得了一些不错的成果。但现有的少样本
论文部分内容阅读
关系抽取是信息抽取技术中的一项重要任务,也是知识图谱构建过程中的重要环节,其目的是从非结构化的文本中抽取出结构化的三元组知识。这一技术有着极大的商业价值和落地需求,然而现有的关系抽取系统在落地实现的过程中,普遍面临着两大问题的挑战——冷启动数据需求问题和运行中增量数据处理问题。近年来,越来越多的研究者开始关注这些问题,少样本关系抽取技术在应对冷启动数据需求问题上取得了一些不错的成果。但现有的少样本关系抽取方法都是从样本出发进行关系建模,这可能会在极少量样本的情况下出现关系建模偏差从而影响模型性能。而针对增量数据处理问题进行研究的持续关系抽取方法目前处在起步阶段,研究成果较少,且存在灾难性遗忘、次序敏感等问题,尚有较大提升空间。基于此,本文提出了一种少样本关系抽取模型和一种持续关系抽取模型。本文贡献主要包括:(1)提出了一种元学习多分类器集成的关系抽取框架,利用元学习方法训练分类器初始化参数,使其能够应用于少样本关系抽取任务;(2)提出了一种利用外部知识图谱建模关系语义表示的方法,并利用此方法获取多重训练标签,重构元训练任务序列,提升了元学习少样本关系抽取模型的性能。(3)提出了一种元学习持续关系抽取框架,结合模型交互信息和任务语义信息进行负采样,并使用实例表示筛选记忆实例,提升了模型抗灾难性遗忘和抗次序敏感的能力,在多个数据集上获得了最优的性能。(4)分析了关系抽取系统应该满足的功能和非公能需求。在此基础上,提出了一个关系抽取系统的详细设计方案,并对该系统进行了实现。综上所述,本文提出了一种基于知识增强的元学习少样本关系抽取模型和一种基于关系感知的元学习持续关系抽取模型,设计并实现了满足实际需求的关系抽取系统。
其他文献
目前,我国可再生能源发展迅速,2020年可再生能源发电量达22148亿千瓦时,同比增长约8.4%,截至2020年底,我国可再生能源发电装机达到9.34亿千瓦,同比增长约17.5%,为了促进可再生能源发展,保障其电量消纳,同时缓解给电网调节带来的压力,研究促进可再生能源发展的电力市场机制,推动可再生能源的市场化进程,充分利用市场这只手在资源配置中的基础性作用,凸显可再生能源在市场交易中的绿色属性,对
目前,随着互联网技术和智能移动设备的快速发展以及低功耗蓝牙的出现,基于蓝牙的室内定位技术受到越来越多学术界以及相关行业的关注。蓝牙位置指纹室内定位方法虽然在近几年不断改进而日趋完善,但仍存在着一些问题需要解决:实际环境下,接收信号强度指示(Received Signal Strength Indication,RSSI)并不完全服从正态分布,使用常规滤波方法得到的RSSI指纹质量较低;加权K邻近法
汞是一种在常温下以液态形式存在的重金属元素,具有较强的挥发性、生物累积性、迁移性和毒性。化石燃料燃烧、金属冶炼、水泥生产等人类活动是汞污染的主要来源。中国长期以来是一个燃煤大国,2015年汞排放量达469 t,其中因燃煤导致的汞排放占40%。目前燃煤电厂已采用污染物控制装置协同脱汞,但燃煤副产物如脱硫石膏、吸附剂、飞灰中汞仍然具有二次释放的可能性,需引起重视。目前固体废物中汞的稳定化技术有土壤洗涤
随着电网能源转型的不断深入,现代电力系统正在逐步向源荷互动、大规模新能源消纳、特高压交直流互联等方向发展。一方面,新能源的大规模并网使电力平衡呈现出明显的空间、时间不均衡,调峰调频压力突出,现有的发电跟踪负荷的模式已无法适应电网的发展;另一方面,负荷侧设备更加多元化,分布式发电、分布式储能、电动汽车等资源的大量应用使得负荷端的灵活可控性增强,为电网提供了丰富的可调资源。大规模可调的负荷侧资源如何参
在全球能源危机的背景下,人们提高了对风能、太阳能等可再生能源的开发力度。并网逆变器因为控制性能良好且运行模式灵活多变,常被用于电网与可再生能源之间功率转换的接口。然而随着新能源在电网中渗透率的逐渐增加,电网表现出弱电网特性。电网阻抗的大范围变化可能引起系统的稳定性问题,此外,电网背景谐波也会影响并网电流的波形质量。本文分别针对与电网直接耦合的逆变器和通过变压器并网的逆变器,提出改进前馈控制策略,提