基于多本体的语义标注模型的研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:zimomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的指数增长,用户很难快速精确地找到自己想要的信息。这是因为现有的网络信息是设计给用户阅读的。Tim Berners-Lee提出的语义网概为了解决这个问题。语义网是一种智能的网络,在现有的网络上增加一层语义信息,而这层信息是利用本体来对网络内容进行形式化的描述,并通过标注来表示出来,从而实现计算机能理解网络信息的内容。语义标注通过为网络内容增加语义信息,从而实现语义网。  目前大部分的语义标注工具都是基于单本体的,而页面通常涉及多个不同领域的内容。基于单本体的语义标注工具不仅对本体要求严格,同时无法覆盖页面更多的内容,而且对标注结果的检验无法实现自动化。本文提出了一种基于多本体的语义标注模型。该模型包括四个部分:本体匹配模块、多本体语义信息抽取模块、语义标注模块和结果验证模块。本体匹配模块对多本体的概念进行分析,得出多个本体不同概念之间的关系,并根据概念的性质,形成JAPE规则;多本体语义信息抽取模块在多个本体的指导下,使用基于本体的信息抽取技术抽取出本体中概念的实例;语义标注模块通过将信息抽取的结果与本体相连接来进行语义标注;结果验证模块根据不同本体的概念之间的关系对语义标注的结果进行验证,并进行修复工作。在本模型中,语义标注结果没有嵌入到网页中,而是独立存储起来,这样做便于语义标注信息的检查和更新。  针对该模型,本文设计同时实现了一个原型系统,该系统通过实现Web服务的方式实现了多本体语义标注的功能。最后通过高校的招生信息页面对系统进行了验证,实验结果表明本文提出的多本体语义标注模型和验证算法是可行的,语义标注达到较高的准确率,结果验证模块自动指出了大部分语义标注结果不准确的地方,减轻了检查语义标注结果的工作难度。
其他文献
云计算、物联网、移动互联、社交媒体等新兴信息技术和应用模式的快速发展,促使全球数据量急剧增加,推动人类社会迈入大数据时代。大数据应用背景下,用户对存储空间的需求越来越
认知无线电网络作为一种革新的通信范例,通过动态频谱共享,有效提升了紧缺频谱资源的利用率。认知无线电网络中的认知用户通过与周边环境进行交互,自适应调节传输参数,以共享授权
随着大数据时代的到来,全球数据总量爆炸式增长,云存储系统的规模越来越大,系统中硬盘故障的发生频率也因此变得越来越高。传统的被动容错模式只能通过不断增加冗余保证系统可靠
学位
随着移动互联网快速发展,移动终端面临的安全威胁也日益突出。Android系统凭借其开源、易定制的特性,已占据移动智能操作系统绝大部分的市场份额。自2008年的1.0版本以来,Androi
图像中的文字定位与提取是当前热门且具有实际应用意义的课题。随着数码产品的普及,网络中出现大量来源于各种场景下的图像,检测和识别这些图像中的文字在工业界正越来越受重视
无线传感器网络是由大量传感器节点通过无线通信方式组成的一个多跳自组织网络,用以实现对物理世界的监控,是影响人类未来生活的十大新兴技术之一。而节点自定位技术作为无线传
学位
在大数据环境下,每天产生海量数据,并存储在数据库系统中。很多时候,系统新来一个数据,都需要查询该数据是否已经在系统中,也就是对数据的查存。随着数据量增大,查询一个数据是否已
学位