面向文本的自动语义标注技术研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:darkage12223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网在人类社会中扮演了越来越重要的角色,成为人们工作生活中主要的信息来源和交互平台。互联网所包含的海量数据资源中蕴含着海量信息,必须对数据进行有效地处理才能从中挖掘出有价值的信息。语义标注技术是将计算机无法直接处理的半结构化和非结构化的多媒体数据转变为语义数据的有效手段。语义标注是语义推理的基础,是以本体为指导、为多媒体数据添加概念实例、数据属性和对象属性的过程,使数据资源从机器可读上升到机器可理解,能够有效实现跨域多源数据资源的集成和共享,为上层数据资源的语义检索和管理提供支持。本文研究了一种面向中文文本的自动语义标注框架,主要工作包括三个方面:1.论文设计了一种自动语义标注框架,包括创建实例、概念标注和属性标注三个阶段。在前两个阶段中,利用命名实体识别算法完成对实体类、时间类和数字类命名实体的自动识别与概念标注。基于条件随机场模型的语义标注算法具有避免独立性假设、避免标注偏置、能够融合大量特征等特点,通过分析了不同实体类命名实体(人名、地名和机构名)的构词特征,并据此推断在具体的识别过程中使用的识别颗粒度(基于字或基于词)。最后通过实验验证了算法的有效性。2.在自动语义标注框架的属性标注阶段,论文利用句法分析器为中文语句构造句法依存树,考虑到对中文长句子的句法解析准确率较低情况,设计了针对中文长句的预处理方法。并基于句法依存树提出了7条启发式规则用于实现关系抽取。最后通过实验证实,预处理操作和启发式规则均能够较大程度上提升关系抽取算法的总体性能。3.基于自动语义标注框架和关系抽取方法,论文设计并实现了面向文本的自动语义标注系统。系统主要包括管理本体文件、自动创建实例、自动完成对实例的属性标注等功能,能够实现基于本体、面向文本的自动语义标注,并实现了自动标注功能和对本体的管理功能。系统测试结果表明,本文所开发的语义标注系统能够实现面向文本的自动语义标注,具有较高的性能表现和实用价值。
其他文献
储蓄国债(凭证式)到期资金约定转存业务创新是近期储蓄国债普惠金融的重要举措,目前还处于推广阶段。本文利用国家金库上海市分库开展的问卷调查数据,通过分析回答了相关政策制定
由中央国债登记结算有限责任公司(以下简称中央结算公司)举办的“2016年中国银行业理财市场年会”日前在北京隆重召开.本次年会以“新常态下银行业理财:创新与发展”为主题,总结
目的:探讨人工髋关节置换患者行健康教育的临床效果。方法:在我院中选取2014年5月-2016年5月所收治的70例人工髋关节置换患者,随机分为对照组(给予常规护理)和观察组(在常规
随着我国经济的发展,体育事业也得到了长足的发展和进步,为了推广全民健身,满足民众对于体育锻炼的需求,社区体育迅速的成为社会体育的重要组成部分,同时也在人们的体育锻炼
本文从当前辽宁环保产业发展的现状出发,分析了发展过程中存在的问题,并提出了加快辽宁环保产业发展的对策建议。
特邀专家:中国人民银行研究局研究员 王宇  特邀专家:中国银行首席研究员 宗良  特邀专家:招商证券首席宏观分析师 谢亚轩  特邀专家:社科院世经政所国际经济研究室副主任 肖立晟  主持人:新华社首席经济分析师 陆晓明  陆晓明:今天我们圆桌讨论的话题是国际金融形势与中国债券市场开放。从今年的国际形势来看,有非常多的不确定性,包括特朗普新政的一些具体效果、美元指数走势、英国进入脱欧程序以后面临诸多
本文总结、分析了2018年中资企业美元债券一级市场发行变化情况及主要原因,分析了二级市场走势及信用利差变化,并对2019年中资企业美元债券市场进行了展望。
利率市场化正在给商业银行带来巨大的机遇和挑战,存贷款定价管理水平已成为商业银行经营决策的重要内容,关系到经营效益及其在市场中的地位。本文在对马鞍山辖内金融机构的定
党的十九大报告作出了“中国特色社会主义进入新时代”的重大判断,具有划时代的里程碑意义。新时代的一个重要特征就是中国日益走近世界舞台的中央,中国在全球经济中发挥着重大的、积极的促进作用。  2017年全球经济呈现向好态势  对于当前全球经济形势,习近平主席2017年11月10日在出席越南岘港亚太经合组织(APEC)工商领导人峰会时作出了最权威的阐释。习近平主席在主旨演讲中指出:“尽管仍然面临风险和不