论文部分内容阅读
本文先后讨论了数据质量的产生过程及其影响要素、数据质量问题的表现和分类,以及数据集质量分析的一般方法,研究了当前有关数据质量分析理论并且引入规则库这一概念,在此基础上提出了一套基于规则库的数据质量分析模型,这一模型能清晰的为分析人员从规则建立到指标的计算等分析阶段提供指导。
在前面介绍的理论基础上,本文设计和实现了一个基于这一评价模型的评价系统DataQualityAnalyser(DQA)。考虑到当前网络、多操作系统应用普及的大环境,因此本系统采用了XML、WebService等技术并使用C/S模式,为用户提供了一个跨平台、多用户分布式质量分析平台。
本文所提出的质量评估模型是对数据质量研究有益的探讨,具有一定的理论意义,在本文设计的数据质量分析平台上对该模型进行了实现,在日后的研究过程中也有其启发意义。数据质量分析系统DQA,向用户提供了一个容易使用,界面友好的分析流程,增加了系统的实用性,这些都是对数据质量技术的应用很有意义的研究。