【摘 要】
:
近年来,随着信息技术的不断发展,互联网上的各种信息越来越多。当我们搜索某一事件时,往往会淹没在海量相关的新闻文本中,无法从中直接获取有效信息从而把握事件的主要发展脉络。如果想快速、全面的了解该事件,就需要从海量新闻文本中提取出事件相关的信息,然后利用这些信息构建事件的发展过程,并推理事件可能的发展趋势。因此,如何从新闻文本中抽取事件信息,刻画事件的演化过程,并推理事件未来可能的发展情况,已经成为自
论文部分内容阅读
近年来,随着信息技术的不断发展,互联网上的各种信息越来越多。当我们搜索某一事件时,往往会淹没在海量相关的新闻文本中,无法从中直接获取有效信息从而把握事件的主要发展脉络。如果想快速、全面的了解该事件,就需要从海量新闻文本中提取出事件相关的信息,然后利用这些信息构建事件的发展过程,并推理事件可能的发展趋势。因此,如何从新闻文本中抽取事件信息,刻画事件的演化过程,并推理事件未来可能的发展情况,已经成为自然语言处理领域的一个热点问题,同时也是一个具有很多现实应用场景的问题。本文针对上述问题中的两个关键任务:信息抽取和事件推理开展研究,完成了以下工作:首先,近年来新兴的故事线生成方法是描述事件演化过程中的一种有效方法。与时间线生成等方法相比,故事线可以捕捉事件的主体结构,但是目前的研究中大多是用从新闻文本中抽取的摘要作为故事线的节点,这种形式的故事线可读性较差,并且对于地点信息的抽取不够准确。本文提出一种基于知识图谱的故事线构建方法,以事件的三元组作为故事线的节点,相对于传统的摘要故事线,以三元组形式作为节点可读性更强,而且在信息抽取过程中会将地点实体抽取出来,用其来指导局部故事线的构建,准确度更高。同时,随着各种预训练语言模型的提出,传统静态词向量的一些劣势可以被改进,例如一词多义的问题。为了获得带有语义信息的动态词向量,本文在文本预处理阶段采用了预训练模型BERT用于生成更好的词向量。其次,在事件推理模型中,为了得到更好的事件表示,本文提出了基于自注意力机制的事件表征层,这样不仅能够得到该事件本身的表征,还能引入其他事件片段的表征,两者结合使得模型可以捕捉更多的有效事件信息。最后,本文以台风事件为背景,收集了大量相关事件新闻,构建事件数据库,并对本文提出的故事线生成模型和基于事理图谱的事件推理模型进行实验验证。实验结果表明了所提模型和方法的有效性。综上,本文基于深度学习、事理图谱等方法构建了一个文本事件分析的完整的流程和事件分析方法,可以有效缓解网络信息过载等问题,同时还可以应用于各种事件信息挖掘任务中。
其他文献
海底采矿投资者面临复杂的监管制度,包括国际海底管理局与担保国的双重监管。对于投资者与管理局之间的争端,国际海洋法法庭具有管辖权,而对于投资者与担保国之间的争端,国际海洋法法庭未予明确规定。因此,当投资者与担保国之间发生争端时,投资者的利益如何得到保护将是一个十分值得关切的问题。国际投资条约是为了保护在东道国领域内进行投资的外国投资者利益而订立,然而,国际海底区域的特殊性是其位于国家管辖范围之外,同
检察机关在刑事诉讼活动中的各个阶段都能以多样化的职能推进非法证据排除工作。检察机关在以多样化的方式推进非法证据排除工作时,实际是通过法律监督机关的整体性角色定位在非法证据排除中延伸出了监督者、裁判者等更为具体的角色。非法证据排除中检察机关的角色多重性与其整体性的法律监督机关的角色定位并不冲突,但检察机关的监督者、裁判者、公诉人乃至侦查者的具体角色在现实的非法证据排除实践中并不必然是和谐有序的,而是
由于提升可再生能源接入与降低发电碳排放,需求响应技术越来越受到关注。建筑是具有高水平负荷调节能力和能源灵活性的能源用户,这表明它们具有提供需求响应服务并实现电网功率调节目标的潜力。介绍了基于空调系统室内温度设定值控制的建筑需求响应方法;所提出的方法可以用于具有基本反馈控制功能和通信协议的建筑空调系统;建立了考虑温度和建筑热特性影响的负荷预测模型,并在办公建筑进行现场测试,以验证该方法在需求响应实际
夏季用电高峰期间,办公建筑空调负荷占比重大且逐年递增,短期调控不会影响人员热舒适,是具备需求弹性的柔性负荷,因此,研究办公楼宇空调柔性负荷调度潜力,对缓解高峰用电具有重要意义。论文分析了办公建筑空调负荷,得出其具有容量大、体量多和使用时间集中的特点,可作为建筑柔性负荷调度其用电负荷。因建筑本身的热惰性、空调系统时滞性以及人体的热舒适温度区间等原因,建筑空调负荷具有可调度性。以青岛市某办公楼为原型,
应有部分是指按份共有人对共有物所有权所享有的比例,应有部分具有所有权权能,包括占有、使用、收益及处分权能,本文围绕按份共有中应有部分的处分展开论述。我国《民法典》301-307条、《最高人民法院关于适用<中华人民共和国民法典>物权编的解释(一)》(以下简称《解释》)9-13条规定了应有部分之内涵、应有部分的分出、应有部分的转让及其他共有人享有优先购买权。然则应有部分之处分除法律明文规定的分出、转让
<正>并政办发[2018]62号各县(市、区)人民政府,综改示范区、不锈钢园区管委会,市直各委、局、办,各有关单位:《2018年太原市创建国家生态园林城市实施方案》已经市人民政府同意,现印发给你们,请按照执行。2018年11月12日2018年太原市创建国家生态园林城市实施方案根据住建部《国家园林城市系列标准及申报评审管理办法》和我市创建国家生态园林城市工作实际,制定本实施方案。
随着人们交通出行需求的不断增多,机动车数量逐年攀升,而由机动车引起的交通事故也逐渐变成了一个每天都在发生的,极其日常的生活现象。在机动车发生交通事故后的损失赔偿纠纷中,直接损失通常是根据相关的法律规定进行类型化的处理,争议相对较少。但其中涉及到的一些间接损失,可期待利益损失等,就成了实践中的难题。如何认识和处理机动车发生交通事故之后,营运车辆所产生的停运损失问题,这是一个看似普通却并非容易解决的法
非法集资类犯罪案发率高、覆盖面广、危害性大,严重损害了国家的金融安全、人民的财产安全以及市场的经济秩序。为遏制非法集资类犯罪的高发态势,国务院多次出台文件强调要依法惩处、严厉打击。由于刑法规定的非法吸收公众存款罪为简单罪状,司法解释规定的构成要件也存在措辞含糊以及外延宽泛的问题,因此司法实践扩张非法吸收公众存款罪的适用范围,将其作为打击非法集资犯罪的一把利器,使其沦为了非法集资类犯罪的“口袋罪”,
原始生殖细胞在小鼠中起源于6.5 dpc胚胎的近末端外胚层,受Wnt信号和BMP信号诱导形成。PGCs在9.5 dpc开始沿肠系膜向生殖脊迁移,在迁移的过程中伴随着细胞增殖,在12.5 dpc基本全部进入生殖脊,13.5 dpc停止有丝分裂,随后进入性别分化阶段。在PGCs的形成、增殖、迁移过程中,表观遗传修饰如DNA甲基化、H3K9me2、H3K27me3发生变化。有报道称PGCs中H3K27m
智能时代背景下的大数据技术的突飞猛进使得人类社会发生了日新月异的变化。大数据经济下,信息主体可以获得便利的服务,但是就像一枚硬币有正反面一样,人们在享受着便利的同时,也不可避免地承受着其中的风险。个人信息安全问题成为人们热议的话题。为了保证信息安全以维护自身利益,信息主体会严格把控个人信息,尽可能少地将个人信息向外流出。如此一来,与大数据采集使用个人信息的需求相矛盾。因此,如何平衡两者之间的关系成