可扩展的数据质量分析系统及其软件实现研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:menangchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文先后讨论了数据质量的产生过程及其影响要素、数据质量问题的表现和分类,以及数据集质量分析的一般方法,研究了当前有关数据质量分析理论并且引入规则库这一概念,在此基础上提出了一套基于规则库的数据质量分析模型,这一模型能清晰的为分析人员从规则建立到指标的计算等分析阶段提供指导。 在前面介绍的理论基础上,本文设计和实现了一个基于这一评价模型的评价系统DataQualityAnalyser(DQA)。考虑到当前网络、多操作系统应用普及的大环境,因此本系统采用了XML、WebService等技术并使用C/S模式,为用户提供了一个跨平台、多用户分布式质量分析平台。 本文所提出的质量评估模型是对数据质量研究有益的探讨,具有一定的理论意义,在本文设计的数据质量分析平台上对该模型进行了实现,在日后的研究过程中也有其启发意义。数据质量分析系统DQA,向用户提供了一个容易使用,界面友好的分析流程,增加了系统的实用性,这些都是对数据质量技术的应用很有意义的研究。
其他文献
伴随着计算机技术、特别是网络技术的飞速发展,用户所能接触到的空间数据量迅速增加,但由于与数据相关的应用平台、数据库产品以及通信协议等方面的差异,使得各个数据源之间的互
本文主要研究了基于三维空间散乱点的三维数字地表建模算法和地表模型上的最短路径问题,讨论了三维体障碍物群中的最短路径问题,并结合OpenGL编程实现了地表的模拟显示和控制
随着高性能计算应用需求的发展,单台高性能计算机已经不能胜任一些超大规模应用问题的解决,这就需要将地理上分布的、异构的多种计算资源通过高速网络连接起来,共同解决大型
随着科技的发展,计算机网络技术、可视化技术和数据管理技术已经成为推动很多领域发展的关键技术,尤其在地震勘探行业,对这些计算机技术的需求更为迫切。通过利用可视化技术对地
随着计算机技术的飞速发展,互联网在当今世界经济中变得愈来愈重要,各企事业单位也纷纷构筑自己的Internet环境。网络在给我们带来极大便利的同时,也带来了另外一个不容忽视的安
本文分析了下一代互联网网络管理的QoS需求,并在此基础上提出了支持策略管理和工作流管理的下一代互联网网络管理模型,该模型实现了下一代互联网IP业务的业务流程自动化、业务
本课题主要研究小波变换在心电信号特征提取中的应用,它是心电信号处理领域中的基础性研究。 心电图的QRS波群包含了人体心脏电活动的丰富信息,对它识别的好坏在临床诊断
随着我国经济的飞速发展,对各种能源的需求与日俱增,能源短缺问题日日突出,尤其是对石油的需求更是紧迫,如何解决我国石油能源紧缺问题是许多科学工作者正在潜心研究的重要课
随着信息时代的到来,信息技术对人类社会影响的范围愈来愈广,企业必将不可抗拒地加速进入信息网络时代。对电力企业而言,建设具有本企业特点的,生产过程自动化和管理现代化的信息系统,具有非常重要的意义。它将使电力企业能够应用信息化的手段进行行政和技术管理,降低生产成本,合理规划电网建设,从而增强电力企业的竞争力。 电力企业对设备的停电检修是影响电网供电可靠性的主要因素之一,同时设备的停电检修计划又是
容迟网络(DTNs)是一种不存在稳定端到端连接的网络,具有长时延、间歇中断、节点缓存小和计算能力低等特点,已广泛应用于社交网络、车载网络、灾难救援、环境监测、军事战略等领