论文部分内容阅读
海洋数据的质量是数据处理和应用的基础,由于海洋本身存在的不稳定性,人类认知和表达能力的局限性,以及海洋数据在采集、处理、传输和使用中存在的变异和衍生,使得人们对现实海洋世界的抽象和表达总是存在误差,而误差的大小直接影响着数据质量的好坏,及海洋数据的应用程度。因此,如何准确高效的评价海洋数据的质量,是制约其精确有效应用的关键问题之一由于海洋数据的具有的大数据特征和空间性,使得对海洋数据的质量检验方案无法完全等同于对一般工业产品的质量检验工序,需要考虑海洋数据批量随机,专题应用性强等特征对海洋数据质量检验方案造成的影响。本课题在现有研究的基础上,结合海洋数据大批量、多来源、多属性等特征,提出了优化的海洋数据质量检验方案。本课题主要从海洋数据的质量检验方案和质量评估方案两方面进行了相关的研究和算法的提取,并与现存的标准GB/T 2828.1(2012)和ISO/TC 211进行了对比和分析,研究的主要内容如下:(1)介绍了本课题的研究背景及在大数据新环境下由于数据质量可能引发的潜在问题,综述了以往对于空间数据的质量检验模型、国内外相关标准和协议、空间数据的质量元素等相关方面的研究现状,由此指出目前在海洋数据的质量检验理论及评价方法中存在的问题。(2)针对需求驱动的,具有多维、多源、多尺度等特征的海洋数据,提出了基于AQL (Acceptance Quality Limit, AQL)的海洋数据质量检验方案,在改进空间一次抽样检验模型的基础上,引入AQL作为数据合格程度的判定参数,使用基于超几何分布的接收概率计算方法,建立数据批量与样本量之间的关系,并通过实验验证了方案的可行性。(3)针对海洋数据的专题性及数据可用性,结合粗决策的思想,从数据的质量元素层面评价面向应用的海洋专题数据集。通过建立海洋数据质量元素粗集,参考常见空间数据质量元素之间的依赖关系,对属性集进行约简、定权,制定了基于粗决策的数据质量评价方案,解决了在不同专题情况下质量元素的筛选和定权的问题。(4)结合海洋数据的质量检验方案和质量评估方案,提出了基于AQL的海洋数据质量检验模型,并应用于实际海洋预报数据的质量检验,通过与传统百分比抽样方案、GB/T 2828.1(2012)查表所得的质量检验方案和ISO/TC 211质量评估方法进行对比,证明了质量检验模型在保证质量检验严格度和精度的前提下具有高效性和灵活性。