基于图文相关的突发事件图片采集研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:gerui1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体作为一种互联网时代的大众媒体工具,其在一定程度上避免了传统媒体所具有的传播平台单一以及传播渠道狭窄等缺陷,为现时代中国社会的发展带来了巨大影响,同时由于社交媒体能够在短时间内形成巨大的舆论场,因此其已成为突发事件的主要话语集散地。目前对社交媒体的相关研究大多基于文本信息开展,而在众多传播媒介中,具有直观性和易传播性等特点的图片在突发事件信息的表达与传递方面具有举足轻重的作用。因此,检索特定突发事件下的相关图片对突发事件信息分析及辅助政府决策具有重要作用。
  本文对突发事件相关图片的采集研究主要从突发事件信息获取以及图片事件相关性判定两方面入手。首先,面向新浪微博提出一种基于查询扩展的突发事件相关信息获取方法。该方法基于种子查询词不断扩展特定突发事件下的查询项,进而获取不同查询项下的相关信息,通过查询扩展的迭代进行,可以实现在新浪微博平台布尔检索及限定信息获取条件下对突发事件相关信息召回的提升,保证了候选图片的查全率。其次,本文将社交媒体突发事件下相关图片的识别问题转换为不同检索查询项下相关图片的识别问题,提出一种基于Attention注意力机制的融合图文多模态信息的图片事件相关性判定模型。该模型分别用BERT和ResNet网络结构提取文本特征和图片特征,同时考虑对各模态内特征信息的抽取和跨模态间关联信息的抽取,通过对以上两方面信息的融合,实现了基于图片和文本两种模态异构数据的融合以及基于该融合模型的图片事件相关性判定。
  经实验可得,首先本文所提出的基于查询扩展的相关信息收集方法在新浪微博平台上具有可行性。一方面在新浪微博检索信息的局部反馈文档集选取中,基于微博热度的局部文档集选取方式优于应用较为广泛的伪相关反馈方式。另一方面在突发事件信息检索查询扩展中,人物和地点要素在查询语句中具有突出作用。其次在多模态信息融合中,同时考虑各模态内信息抽取和跨模态间关联信息抽取效果明显优于仅考虑模态内信息抽取和仅对跨模态间关联信息抽取。本文所提出的多模态融合模型F1值为0.90(准确率0.89,召回率0.92),较只考虑模态内部信息抽取和只考虑模态间关联信息的抽取F1值分别提升3%和8%,且图片事件相关性判定各模型在图片事件相关标签数据下的表现均优于或持平于其在图片事件不相关标签数据下的表现。
其他文献
生态移民是平衡经济发展与环境保护关系的重要举措,在现阶段具有扶贫和生态建设的双重意义。目前宁夏生态移民定居率约为60%-70%,定居率不高对于生态移民工程效果具有重要的影响作用,且基于目前研究情况来看,对于生态移民的研究主要围绕搬迁意愿以及移民工程满意度展开,对于农民定居意愿的研究主要是围绕农民工进城以及农民拆迁安置的定居意愿展开,对于生态移民定居意愿还未涉及。本文以生态移民定居意愿作为生态移民问
学位
知识共享是指员工个人的知识财富通过各种交流方式为组织中其他成员所共同分享,从而转变为组织知识财富.该论文主要探讨企业运行中的内部知识共享的基本原理以及企业如何实现内部知识共享.阐述了知识共享的意义,说明了什么是显性知识及隐性知识.分析了知识的层次以及企业知识的构成.分析了显性知识共享和隐性知识共享的作用,二者如何互相转化.介绍了企业内部知识共享的环节.提出要实现企业内部知识共享,首先要实现知识编码
学位
该文从理论的角度,主要运用了经济学、新制度经济学、金融学、投资学和相关理论对投资基金的功能进行了全面的分析,力求通过采用交易费用理论、规模经济理论、金融创新理论、资产组合理论构建一个理论框架,来解释为什么会出现投资基金这种金融创新工具?这种金融工具与其它金融工具相比有什么优越之处?通过分析得出的结论是:投资基金具有降低交易费用,提高规模经济,分散金融风险,内部制衡和金融创新的功能.
学位
该文是对中国国有商业银行内部控制问题的专题研究.80年代以来,随着世界经济、市场一体化进展进程的加快以科学技术的突飞猛进,金融国际化、自由化、金融市场一体化的趋势日益明显,金融创新浪潮迭起,并由此推进了各国金融业的长足发展,使金融在世界及各国经济发展中的地位和作用日益重要.
国外税务代理制度的演变大都经历了一个由低级到高级、由不完善到逐步完善的过程.并呈现如下特征;从业主体由个体执业到行业组成组织执业、税务代理范围由狭窄变宽广、税务代理管理由松散到严密、税务代理的业务由单一变为复合等.相对发达国家来说,中国引入并正式实施税务代理制度的历史很短,从1994年国家税务总局颁布《税务代理试行办法》算起,只有几的时间.从实践来看,取得了明显成绩,如顺应了税收制度变革,实现了与
学位
档案学人研究是档案学术史研究不可缺少的内容。20世纪30-40年代,我国档案学在史学界、行政界和教育界的共同努力下得以形成和不断发展,而档案学人是档案学术研究的鲜活基础,为我国近代档案学的形成和发展做出了巨大贡献。因学人之间的共性与联系,他们形成了不同的群体。目前,学界比较重视对行政界和史学界档案学人群体的研究,这两个群体主要是根据学人身份和研究内容侧重来区分的。本文的研究对象是民国时期文华图专档
学位
信息技术的进步对档案馆工作提出了新要求、新挑战。传统的档案服务以被动服务为主、类型单一、服务方式繁琐、服务内容粗糙、“以馆藏为中心”,不能充分满足公众的档案需求。档案馆应积极应用新一代信息技术,为公众提供全面、便捷、智慧的服务。  本文在结构上分为七个部分。第一部分为绪论,主要介绍了研究背景、研究意义,梳理了国内外研究综述,阐述了本文主要研究内容、研究方法和创新点等。第二部分为面向公众的档案馆智慧
学位
随着移动互联网的快速发展与智能手机APP公众使用黏性的不断增强,移动政务APP成为深入推进“互联网+政务”发展的重要引擎,政府部门积极推动公安、社保、医疗、教育等服务向移动端延伸,竞相推出了一系列移动政务APP。社会公众只需点击手机,即可轻松获取政务信息,实现政务事项掌上办理。  各项政务服务的顺利进行,有赖于用户个人信息的收集与提供,其中难免会涉及到诸多个人隐私。大数据时代,个人隐私的外延得到进
随着经济发展与人们物质生活水平的提高,健康意识深入人心,体育锻炼成为保持身体活力与健康的重要手段。“互联网+体育”带动了运动健身APP的产生、发展与繁荣,利用运动健身APP进行运动干预成为大众保持健康的优先选择。虽然运动健身APP的功能已经相当丰富,包括了动态追踪、数据记录、运动指导、社交分享、线上活动、游戏化设计等,但运动健身APP的功能使用率并不高,使用场景有待进一步丰富。有研究指出,当前大学
阅读一直以来都占据着人们社会生活的重要位置,从“全民阅读”被纳入政府工作报告后,阅读成为了整个社会的热门话题。在移动互联的大背景下,人们的阅读习惯也由传统的纸质阅读偏向数字阅读,阅读与社交网络的链接,阅读活动与社交活动的融合,使得阅读社交化越发明显,移动阅读渐渐向着社交型移动阅读的趋势发展。本文选取当前最具代表性的社交型移动阅读平台“微信读书”APP作为研究对象,分析其移动阅读平台的社交性以及由此
学位