面向舆情文本的事件语义聚集融合与激活扩散方法及其应用研究

来源 :上海大学 | 被引量 : 4次 | 上传用户:logepark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,以新闻报道、博客信息、论坛热帖为代表的舆情文本出现了井喷式的发展。面对这些规模海量、增量快速、分布松散、关联稀疏的舆情文本,用户希望能够从其中发现事件的核心语义信息,以帮助他们及时全面地了解事件发展与演化的进程;同时,面对实时发生、动态演化的事件语义信息,用户也希望能够从中发现其所关心的事件知识,以获得个性化的事件知识服务。本文面向舆情文本处理的具体需求,提出事件语义聚集融合与激活扩散方法及其理论,并对相关应用展开研究。具体内容包括:1.以关联语义链网络为基础,本文提出事件语义聚集融合方法,包括:首先,通过事件语义社区发现方法,从舆情文本中进行事件语义的聚集;然后,通过文本映射至事件语义社区以及事件语义社区重构,实现对聚集事件语义的融合,丰富聚集的事件语义。最终,通过关联语义链网络的分裂迭代,不断对事件语义进行聚集和融合,以发现事件语义,帮助用户了解实时动态的事件语义信息。2.通过模拟人类联想记忆激活扩散模型的语义提取过程,本文提出人类联想记忆的语义激活扩散过程,对用户需求相关语义进行扩展。在此基础上,本文提出事件语义激活扩散方法,针对用户事件语义需求,通过语义激活扩散过程,发现事件骨干词汇、事件知识流和事件语义社区三种粒度事件知识,提供个性化且语义丰富的事件知识服务。3.本文将事件语义聚集融合方法应用在事件发现中,提出事件发现算法。首先,提取舆情文本流中文本的语义特征;然后,从中发现已有事件的后续报道,进行已有事件的跟踪;进而,依据事件语义聚集融合方法发现新发生事件。基于六个事件数据集和五种事件发现评价指标,进行事件发现准确率实验和对比实验,以及在线的事件发现场景下的准确率实验和对比实验,并进行性能分析,验证我们提出的事件发现算法的准确性和有效性。4.本文将事件语义激活扩散方法应用在事件知识推荐中,提出事件知识推荐算法。针对用户知识需求,通过事件语义激活扩散方法,向用户推荐多粒度事件知识,并提取相关文本作为事件知识背景,帮助用户加深对事件知识的理解;同时,感知用户兴趣变化,对用户兴趣偏好进行增强和抑制,使得后续推荐更加符合用户个性化需求。基于六个事件数据集和四种推荐评价指标,进行事件知识推荐对比实验、事件知识交互推荐实验,并对事件知识推荐案例和算法性能进行分析,验证事件知识推荐算法的准确性和有效性。本文的研究内容为面向文本的事件语义研究及其应用提供了理论支持和具体方法,可应用于面向文本的事件语义组织和表示、事件的语义标注、事件检测与跟踪、事件语义搜索、事件知识提取,事件语义推荐等方面,在一定程度上解决Web事件信息爆炸而知识匮乏的问题。
其他文献
本文叙述了电机研制产品可靠性特征至随时间而发生变化的规律。通过实例介绍了如何控制产品研制进度、确定研制时间,使产品可靠性最终满足设计要求的可靠性。
目的探讨二甲双胍联合达英-35治疗多囊卵巢综合征的疗效。方法选择2012年1月~2013年10月在我院就诊的96例多囊卵巢综合征(PCOS)患者为研究对象,随机分为观察组和对照组,每组
以成都某超高层项目为例,介绍了BIM技术在模板工程施工精细化管理中的实践与应用。主要从模板工程方案设计、BIM技术在模板工程施工中的应用方法、BIM技术助推模板施工精细化
随着我国的社会经济和科学技术的迅猛发展,计算机技术有了长足的进步,在此情况下,对传统的媒体有着非常大的挑战和冲击。要在越来越激烈的市场竞争中占据一席之地,相关的传统
电波传播一直是环境电磁特性和工程电磁场理论研究领域中最为人们广泛关注和研究的方向之一。随着现代无线移动通信技术的飞速发展,对流层中的电波传播特性的分析与计算是人们
家庭经营是适合于各种生产力水平的农业经营方式。在我国目前必须坚持和巩固家庭联产承包责任制。但是 ,由于我国现在的家庭经营是和落后的农业生产力相联系的 ,它需要不断的
考察了当前我国城市园林绿化的三种动力,及其引发的三种倾向,指出这些倾向的必然性和暂时性,呼吁人们冷静对待这些倾向;同时着重阐述了不宜把景观生态学对景观的理解,与风景
介绍李今庸辨治神志病经验,包含3个方面:①五脏辨治重心肝;②六腑辨治重胆腑;③病因辨治重痰邪。
近些年来我国建筑工程建设取得了突出的作用,对建筑行业发展提出了更高的要求,考虑到管理指标以及应用模式的具体要求,要对创新思维进行分析,突出管理重点。建筑工程管理的影
提出了采用辛普森三点式进行电刷使用寿命评估的方法。经初步试验,用该方法不但能快速且较准确地评估电刷的使用寿命,还可分析评价电刷的工作状况。