面向维基百科多模态数据的知识抽取方法研究

来源 :河北科技大学 | 被引量 : 1次 | 上传用户:wandd_wind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金属材料领域的知识图谱构建过程中文本数据或者结构化数据的挖掘被更多关注,而多媒体数据的挖掘则时常被忽略。在一些特殊的问答需求中(例如可视化问答)这些知识图谱能够发挥的作用是有限的。本文设计了一种从维基百科多模态数据抽取金属材料领域知识并构建多模态知识图谱的方法。受到IMGpedia的启发,在文本挖掘的基础上进一步挖掘图像数据,与IMGpedia不同的是引入了基于深度神经网络模型的图像特征分类方法用于提取图像的视觉标签。除此之外通过将文本描述作为图像关联的上下文,利用实体注释系统得到了丰富的与图像关联的文本实体标签。同时基于WordNet和DBpedia的层次结构关系设计了基于拓扑结构的数据融合方法,将从图像视觉和文本描述中挖掘得到的知识进行融合,最终构建轻量级的多模态知识图谱。本课题做了以下研究工作:1)设计了基于深度神经网络模型的图像视觉标签生成策略。利用VGG-Net对图像视觉特征进行挖掘,通过对视觉特征分类为图像绑定视觉标签,而并非仅获取图像的简单视觉描述符。此外,设计了新的评价标准用于评价图像视觉内容处理的结果。与图像分类任务的评价标准不同,新的评价标准基于分类标签和图像视觉内容计算标签的合理性,本文将其定义为满意度。2)基于图像描述性文本和DBpedia,为图像获取其文本语义表述的文本标签。图像的描述性文本被作为上下文用于扩展图像关联的语义内容,利用DBpedia-Spotlight挖掘图像描述文本,获取图像对应的文本实体,这些得到的文本实体被视为与图像关联的资源。此外,设计了新的策略用于为DBpedia-Spotlight设置参数,使其能够更好的作用于本文的数据。3)设计了基于拓扑结构的多模态数据整合策略和方法,用于构建轻量级的多模态知识图谱。在WordNet和DBpedia的层级结构基础上,设计了图像关联资源的扩展策略和基于有效概念的概念筛选策略。定义了一组用于连接图像与文本、文本与文本的关系属性。设计了原型系统对相关的过程和结果进行展示。
其他文献
动力电池系统是纯电动汽车仅有的动力储备,电池系统集成技术的水平制约着纯电动汽车走向更大的市场。在加速、爬坡、高压直流快充等工况下,动力电池电芯会因为自身特性反应产热,温度快速升高。高温会导致电池循环寿命下降,并影响电芯的一致性,降低整个电池系统成组后的性能及行车安全。开发合理的控制系统对电池冷却、加热实施控制,将有助于电池系统性能的维持和整车安全高效地运转。本文结合某企业“动力电池热管理系统”项目
数字金融是技术驱动的金融创新,其兴起对金融业务产生影响,使金融开始突破时空限制。作为现代经济的核心内容,金融业的发展为实体经济的健康发展、资源配置效率的提升、新兴业态的出现及成长提供了重要支撑,在我国国民经济发展过程中起着不可比拟的作用。金融集聚作为金融发展到一定程度的产物,是金融高质量发展的重要标志。数字金融和金融集聚作为金融的热点话题,具有研究热度和研究意义。数字金融的发展颠覆了传统金融行业,
随着移动互联网技术的发展、受众娱乐需求的日益增长以及UGC(用户生成内容User-Generated Content)模式产品的快速成长,以头条、微博、抖音为代表的各类UGC产品迎来了蓬勃的发展。在注意力经济的引领下,如何在短时间内吸引并维持用户注意,延长产品使用时间并增加用户粘性成为了业界关注的重点。注意品质可以很好的衡量注意的集中水平,但在UGC产品设计领域,对用户视觉注意品质的文献相对较少,
近些年来,我国未成年人犯罪问题日益严重,诸多未成年人恶性案件相继爆出,由此引发了社会各界的广泛关注。结合调查研究来看,我国未成年人犯罪呈现出了一系列新的特征,诸如:低龄化的趋势明显、犯罪手段更加恶劣、暴力化程度高等等。就我国现行的法律规定来看,未成年人承担刑事责任的门槛比较高,尤其在最低刑事责任年龄的规定上有着严格的限制:只要行为人未满14周岁,无论其实施何种犯罪,无需承担刑事责任。相关数据表明,
2016年,我国原油对外依存度高达65.9%,大幅超过国际公认的50%的警戒线,能源安全成为中央领导人和能源界最关注的问题之一。我国乙二醇的主要生产原料是原油,其供给和原油一样属于高度依赖进口产品。乙二醇作为服装纺织面料、包装箱、包装瓶的重要基础化工原料,连续14年表观消费量平均增速19.22%。进口依赖度长期高于60%,历史最高峰达到83%。由于国内乙二醇市场缺口巨大,煤制乙二醇在2015年左右
十九大后,“放管服”改革进入深化阶段,转变政府职能是“放管服”改革的核心取向,这一轮的行政审批改革的核心在于综合应用行政审批制度改革、权力清单公示等多种简政放权措施,确立政府与市场、社会的权力边界,确定政府的权力范围。在这一轮改革中,根据省、市改革的有关部署,东营市提升卫生行政审批效率、进一步加强行政便民服务体系建设,坚持便民高效,简化办事环节和手续,优化服务流程,构建服务型政府管理模式,为群众办
锂离子电池能够在一定程度上满足社会发展对于储能器件的性能要求,逐渐成为了二次电池大家族中最具潜力的一个发展对象。负极材料作为锂离子电池的重要组成部分之一,其性能的缺陷一直是制约其自身发展的重要因素。在众多的负极材料中,过渡族金属氧化物Fe_3O_4因其安全无害、丰富的自然资源、对生态无破坏性等诸多优点脱颖而出,成为研究热门,它们被认为是接下来锂离子电池潜在的备选负极材料之一。本文通过对Fe_3O_
目的:观察益脑康胶囊联合盐酸多奈哌齐治疗卒中后认知障碍的临床疗效方法:将2019.1-2019.12期间广东省中医院记忆门诊、脑病专科门诊患者中,按照前瞻性队列研究方法,将所有符合纳入标准的卒中后认知障碍患者51例,其中,益脑康联合盐酸多奈哌齐治疗组31例,单纯盐酸多奈哌齐治疗组20例。两组患者均予盐酸多奈哌齐5mg/qn,益脑康联合盐酸多奈哌齐治疗组在此基础上加予益脑康胶囊4粒tid,观察3月。
经过研究生阶段系统的专业学习,意识到必须在关注时代、关注生活的前提下,才能精准确定自己的创作方向,本次毕业展览,通过“物哀”系列主题创作实践,以理论和图像研究为基础,
目的:通过一项随机对照实验观察分析祛瘀生新针法联合刺络药物罐治疗脑卒中后肩手综合征Ⅰ期的临床疗效,验证祛瘀生新理论治疗中风后遗症的有效性,并探讨其作用机制与相关问题,为其临床诊治规范化提供思路与依据。方法:本研究纳入的病例均为宝安中医院脑病科、康复科确诊脑卒中后肩手综合征Ⅰ期患者,病例观察时间为2019年4月至2020年1月,通过病人就诊顺序随机数字抽样并随机分配为两组,本研究最终收集62例,观察