政府开放数据的语义描述与实体同一性研究

被引量 : 0次 | 上传用户:zxjscsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的日益普及和开放数据运动的迅速兴起,智慧城市、信息消费的应用需求越来越多,对政府数据开放的需求也越来越多。政府数据开放就是把政府所掌握的大量原始数据,以“机器可读”的形式,让任何人可免费使用、转化和共享;政府数据开放所开放的数据资源即称为政府开放数据。政府数据开放说易行难,综合对比分析国内外政府数据开放现状,目前我国政府数据开放虽初具数据开放基础,但在宏观层面仍面临数据开放规模较小、数据管理缺乏统一标准等问题;在微观层面,政府到底应该如何开放政府数据?如何描述和发布数据?如何让用户找到并利用这些数据?本文以政府开放数据为研究对象,针对国内政府数据开放所面临的问题和挑战,并以政府开放数据的相关性为基础,基于关联数据对政府开放数据所涉及的两个核心问题即政府开放数据的语义描述和实体同一性问题进行探讨研究。首先,对政府开放数据的相关性进行分析。政府开放数据的相关性体现了数据资源之间固有的关联价值;构建了政府开放数据的相关性四维模型,从不同维度上解析数据相关性类型及价值评价,根据四维模型提出基于关联数据的解决方案,以数据集描述和数据关联发现中实体同一性问题作为解决方案中的核心问题,同时阐述语义描述与实体同一性的因果关系。其次,针对政府开放数据的语义描述问题进行研究。构建政府开放数据的语义描述框架,从描述层、关联层和应用层对政府开放数据进行语义描述分析,将数据集进行分类,按照外部描述和内部描述的方法对数据集进行语义描述,将外部划分为元数据标识信息、数据集标识信息、数据集限制信息和数据集维护信息四类并以领域本体的思想解决数据集内部结构的语义描述问题。最后,对政府开放数据存在的实体同一性问题进行研究,分析实体同一性的类型,并针对政府开放数据从数据集维度来构建实体同一性识别方法流程,具体包括“数据集内部结构识别?构建索引文件?共指实体识别”,在实体识别过程中提出一种基于属性和属性值相似度计算的数据实体同一性判定方法,并利用真实政府开放数据进行方法验证,成功识别数据集中共指实体,突出了研究的可行性;同时对实验结果进行解析,总结方法的不足之处。
其他文献
目前我国大城市,都是广度过大,缺乏深度发展的“摊大饼”模式,这已经严重影响到人们的生活品质。特别是在西安老城区内,风貌需要保护,高度受到限制的历史街区,如城隍庙。这代
[目的]探讨低位直肠癌保肛手术的临床治疗效果。[方法]选择某院2009年3月~2010年9月期间收治的低位直肠癌患者86例,随机将患者分为研究组和对照组,每组43例。两组患者经相关检
计算机与网络的广泛应用,改变了隐私权的内涵。而网络环境下的隐私权侧重于保护个人掌控自己的私人信息的权利。但是,我们在强调保护此种权利的同时,也要防止权利的滥用。这
针对环境友好程度和总体资源节约条件下,实现土地空间的最优化利用和为城市土地规划提供参考和决策依据。本文在传统的RLUAM数学模型的基础上,提出一种基于正余弦算法优化RLU
非晶合金内部原子排列短程有序、长程无序,具有独特的性能特点,其中Fe基非晶合金具有磁导率高、饱和磁化强度高和矫顽力低等优异的软磁性能。作为磁制冷材料的Fe基非晶合金,
随着我国高等教育形式已从“精英教育”步入“大众教育”阶段,民办高校的崛起与发展,我国每年的高校毕业生人数不断剧增,每年都有几百万应届毕业生涌向就业市场,“就业难”成
宫体赋初探张丽“宫体”之谓,始自萧梁,虽是指萧纲、萧绎、徐扌离父子、庾肩吾父子等人创作的“辞藻艳发”、“伤于轻靡”(《南史·简文纪》)的淫艳侧丽之诗,然而“宫体所传,且
期刊
目的:通过建立大鼠原发性肝癌缺氧模型,并在多途径阻断肝癌血供的治疗下,观察肝癌组织中血管内皮生长因子(VEGF)及微血管密度(MVD)表达变化情况,探讨姜黄素对大鼠原发性肝癌
现代公共关系产生于欧美,已有近百年的历史。作为具有管理职能的现代公共关系在树立企业形象,进行产品推广,创造良好环境。促进社会进步等方面发挥了非常重要的作用。所谓公共关
长沙窑创烧于唐代,是隋唐时期外销瓷的大宗。已有研究认为,长沙窑在中国瓷器发展史上有两大突出贡献,其中之一便是最早在中国制瓷史上运用铜作呈色剂在高温中成功烧制出红釉