论文部分内容阅读
苹果在我国栽培历史悠久,是一种高价值的农产品。随着信息时代的来临,苹果产业的“资源仓库”毫无疑问成为了保障产业发展和实现科技创新的重要工具。为了对资源进行深层次的利用,数据建设和整合是基础。我国苹果产业的数据资源既具有普遍性也具有特殊性,深入的分析数据资源建设目前存在的主要问题——包括数据源的解析、数据的规范化描述、数据体系的建设、异构数据转换,数据间语义关联关系发现等,通过科学的理论分析和现代信息技术来解决这一系列问题,是实现数据开放共享和产业信息服务的科学基础。本研究完成了对苹果产业数据的分类和资源体系建设,并对数据的整合和应用进行设计与演示,证实了基于数据整合的结果可以为苹果产业的发展提供一站式服务。通过开展相关研究,取得了以下结论和成果:(1)对苹果产业的特点和资源建设现状进行了分析,并对相关理论基础和关键技术进行系统阐述,明确了我国苹果产业的资源建设现状和关于数据整合的方法手段,为本研究提供了理论基础与支持。(2)对我国苹果产业数据的特点和来源组成进行了深入的研究和分析,明确了各类数据源的数据组成,并对如何获取和采集到这些数据进行了阐述。尤其是对不同类别数据的具体查找方式,细化到数据库名称和书目的类型,对我国苹果产业数据的建设起到很好的指导作用。(3)以数据分析为基础对数据进行了分类,并且立足于科研视角构建了苹果产业数据资源体系,分为8个一级类目,28个二级类目,对各类目下的数据资源进行了详细说明。资源体系的构建,便于数据的分类查找,可以节约用户的时间成本和知识成本,为数据整合提供基础。(4)在明确和完成数据资源建设的基础上,对数据的整合进行了架构设计,包括数据库的建设、数据的清洗、装载、组织和关联。基于ETL技术,用kettle工具实现了多源异构数据的同构化。数据经过抽取、标引及实体间关联关系形成规则的分析,揭示出了苹果产业数据间的多维关联关系,将不同的资源交织渗透到一起,实现了苹果产业数据的系统化和一体化。(5)对数据整合在实际应用过程中的必要性进行了分析,并基于数据整合的结果来选取部分数据来应用分析演示,包括数据的检索服务、知识服务、产业布局、品种结构布局、种质资源分布、病虫害发生及分布情况、基于数据整合的专家咨询等,从各个应用层面来分析和证实数据的整合如何能够为苹果产业的发展提供更综合和更加系统化的一站式服务,解决了用户在实践过程中需要从多个渠道采集数据和寻求不同类型服务的难题,从而为我国苹果产业的发展和科技创新提供数据支撑和资源保障。