语义Web环境下基于模型的数据溯源研究

来源 :中国农业科学院 | 被引量 : 0次 | 上传用户:pj00000pj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的网络环境正在向语义Web的美好愿景不断扩展和演进。然而,数据源的不断增长,信息流动的加快,数据在传递过程中的频繁复制、演化,给信息的可靠性、真实性和可信度带来了巨大的挑战。被W3C称之为语义Web最佳实践的关联数据发布越来越呈现如下特点:数量增长快,质量参差不齐,分布式发布使连接的复用越来越普遍,动态更新进一步导致数据的不一致。其根本原因在于起源信息的缺失。因此,在语义Web环境下,如何应用统一的数据溯源模型定位和查询起源信息,如何在相似网页中辨别真伪,以及如何在关联数据发布中增加溯源元数据,成为亟待解决的问题。论文从目前语义Web研究中存在的瓶颈入手,以语义Web、数据溯源、关联数据为理论基础,以语义Web应用为研究目标,综合运用文献研究、调查研究、系统分析、比较研究、归纳推理和软件工程等研究方法,在以下几个方面进行了创新性探索:(1)开展了语义Web环境下数据溯源模型的比较研究。讨论了DCMI术语、OPM-O、PV、 VoIDP、Prov-O等目前国外主要的数据溯源描述语言,从来源和目的、资源描述角度、主要服务对象和解决的问题、标注方式、词表结构等方面分别对这些数据溯源描述语言进行了比较分析。(2)构建了PROV模型的应用情境。在分析W3C数据溯源推荐标准PROV的基础上,阐释该模型的主要功能,深入解析该标准的核心要素,构建了PROV模型的Web应用情境并进行描述;总结出该模型的Web应用特征:可解析性、语义性和可追溯性。这些工作对于推进国内同行在该标准的框架下,进行分布式环境下信息追溯和起源记录互操作的进一步研究具有一定参考价值。(3)验证了PROV本体描述的起源记录在未来Web应用中的语义表达和查询服务问题。在深入解析Web应用中起源记录的定位、传递模式、实现途径和实现模式的基础上归纳总结出Web应用中起源元数据的四类定位发现机制与两类查询机制。结合语义标注Web页面和溯源信息表达技术,采用在线论文追溯案例,实现了包含RDFa语义标注起源记录的HTML页面显示,并通过可视化方式揭示起源,最后对案例中的起源记录查询服务问题进行了探讨。(4)提出了一种借助PROV本体自动化发现相似网页起源关系的实现方法。针对目前大多数已有的网页内容缺乏起源标注的问题,通过文档的变化过程分析,将文档定义为实体,并由多个语义属性进行特征描述,采用基于语义相似性的聚类方法发现文档间的变化关系,借助PROV本体发现文档的特征变化和责任人。通过属性识别抽取命名实体,建立文档属性的关系,链接到LOD云,借助通用语义本体发现起源的变化细节。最后以“转基因”为主题的网页为例,进行了相似网页内容检测的溯源验证。(5)构建了关联数据的溯源元数据发布框架。从目前关联数据发布特征入手,提出数据溯源的必要性和着眼点。通过实体选择、粒度选择、工具选择的研究,建立了发布框架。基于D2R Server自动构建了用于教学和科研的关联数据,定制了溯源元数据,并实现了系统验证和Sparql终端查询。支持用户对本领域信息资源的共享和有效挖掘、及时跟踪。
其他文献
二战中的大屠杀和9·11恐怖袭击事件都是人类历史上惨绝人寰的大灾难,成为受难民族挥之不去的创伤记忆。电影《特别响,非常近》以在9·11事件中失去父亲的美国男孩奥斯卡的视
法务会计不同于一般的会计、审计工作,在我国还处于起步阶段。随着我国市场经济的发展,法务会计越来越显出其重要作用,具有广阔的市场前景,应加快对其的理论与实践研究,培养
<正>骨性关节炎(OA)是中老年人的常见、多发性疾病。临床以关节疼痛、僵硬及活动受限等为主要表现。随着我国人口老龄化趋势加速,骨性关节炎患者人数也越来越多,约占我国人口
健康社区建设运动和研究在西方社会开展已有数年,但在中国却没有引起足够重视。在文献整合分析的基础上,文章通过对健康社区建设运动、弹性和可持续性等理论的分析和研究,探
为加强SZ公司基层管理工作,深入了解基层管理人员整体素质能力情况,为公司基层管理人员的选育用留提供较为科学的决策参考,笔者根据公司实际,设计了基层管理人员人才盘点方案
欧盟投资者适当性制度主要体现在《金融工具市场指令》及其实施指令当中。投资服务客户分类是前提,投资公司履行"了解客户"义务是基础,投资公司"最佳执行"要求是核心,也是投
阿马尔那书信为古代埃及与西亚大国、叙巴地区小国之间的外交信函,反映了当时的西亚北非地区间的国家关系。第一号书信为埃及法老阿蒙霍特普三世写给巴比伦王卡达什曼恩利勒
互联网逐渐成为了人们获取信息的重要途径,随用户的不断增加,互联网信息服务的问题也不断呈现,为提高信息服务的质量和水平,本文对互联网信息服务存在的问题进行了分析,同时提出了
美国俄勒冈州《涉外侵权和其他非合同请求法律适用法》是美国采用普通法制度的州之中第一部侵权冲突法的成文法,体现了美国新型冲突法规则的特色。它明确限定适用法院地法的
社会危害性理论曾经是承袭于苏俄的中国刑法学体系的立论基础,也是当代中国刑法理论中不可逾越的重要问题。围绕社会危害性理论,近年来学界争议颇多、据颂不一,而问题主要集