异构关系数据的迁移学习界限及其在角色识别问题中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:july1126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,互联网越来越成为民众表达自己利益诉求、发泄自己情感以及跟其他民众进行思维讨论碰撞的一个新平台。但由于网民素质参差不齐,热点事件到底是确有其事还是恶意炒作,这就需要分析网民的言论,识别出网络舆情中的各种角色,从而做出正确的回应。突发事件来临的时候,需要第一时间对引起的讨论进行分析和回应,人力进行全部内容的分析非常不现实,立即建立识别模型也不可行,因此需要从事先建立的模型中选择一个和突发事件最相近的模型来对舆论角色进行识别。这就需要用到本文中所提出的角色识别模型和不同领域间的模型迁移。首先,本文对异构关系数据的迁移学习界限及其在角色识别中的应用的背景和意义作了阐述,列举了相关理论的研究现状,并指出了其不符合实际应用的原因。然后在已有研究的基础上,提出了一种新的度量方法,并给出了异构关系数据的迁移学习界限的理论证明及扩展。其次,本文给出了角色识别模型的建立过程及单领域模型跨域迁移的适应性增强方法,将提出的领域距离的概念和迁移界限最优化过程直接运用到模型迁移的过程中,然后对比了不同领域间迁移的角色识别效果,以及与现有的方法做出了比较。最后,本文通过对不同网络载体进行建模,并得到不同领域间的相似性以判断是否适合迁移,同时给出了迁移之后的角色识别结果,为将来实际使用给出了一个样例。根据对实验结果的比对分析,证明了本文提出方法的有效性以及关系数据领域间模型迁移的可行性。
其他文献
远程镜像又叫远程复制,是容灾备份的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。它利用物理位置上分离的存储设备所具备的远程数据连接功能,在远程维护一套数
随着网际网络的快速发展,Web生活与人们的日常生活休戚相关。然而网路环境复杂多变,用户的讯息很容易被截获和复制。认证用户身份的合法性,保护用户敏感数据隐秘性,将倍受关
语言模型(Language Model)是描述自然语言内在规律的数学模型,在机器翻译、语音识别、文字处理、信息检索等领域中占据着十分重要的地位。一个可靠的语言模型对于提高机器翻
随着Internet的迅猛发展,文本信息的数量也日益增加,文本信息的自动处理也变得越来越重要。文本分类作为自然语言处理的一个基本问题,是文本信息处理中的一项主要技术,受到文
写作是大规模语言考试中用于衡量应试者语言知识和词语组织能力的重要途径,然而基于人工评分的方法存在以下缺点:一是耗费巨大的人力、物力、财力。二是评分的主观性强、误差
基于MVC设计模式的J2EE软件开发正成为当今软件开发的一个热点,本课题中物流实训系统的设计和实现正依赖于MVC设计模式,并最终以Browser/Server结构形式实现。传统J2EE架构使
随着信息智能化进程不断推进,人工智能已经广泛应用于各个方面。尤其在医疗诊断领域,越来越多的生理指标和疾病类型,加大了医生诊断疾病的难度,为了解决这个问题,许多研究学
随着当今社会信息化程度的不断提高,企业应用往往需要从大量异构、分布、自治的多数据源中提取数据,如何屏蔽底层异构数据源,将异构数据映射为统一的数据模型,以及如何快捷有
伴随无线通信技术的快速发展,人们希望能够通过无线方式接入互联网络,最近几年,越来越多的人群开始在日常的工作和生活中使用PDA等移动手持设备。对于企业用户来说,手持设备
本文针对阶段性事件驱动架构(SEDA),设计出一套自适应性能控制机制。过去几年因特网爆炸性的增长引起了大量新的网络服务在全世界范围内快速普及,网络服务已经成为一种重要的